The invention discloses an object encoding and computing method in a database system, a database management system and a database server. According to the relativity of several object sample spaces in the database, a global object sample space is formed, and a global dictionary table is created in the global object sample space. The global unique coding value is provided for each object as its object identification, and the mapping relationship between object identification and object description information is ensured. Based on the global dictionary table, the database object is encoded and compressed to reduce coding overhead. Furthermore, the database query operation is carried out directly by using the object identification, and the operation of string type is optimized into the operation of integer type, which improves the efficiency of operation.
【技术实现步骤摘要】
数据库系统中对象的编码及运算方法与数据库服务器
本专利技术涉及数据库
,并且更具体地,涉及一种数据库系统中对象的编码及运算方法、数据库管理系统与数据库服务器。
技术介绍
现代化信息处理是建立在基于对象标识(ID)的认识模型上的,在该认知模型中,任一样本空间中对象(Object)都有一个标识(ID),以区别于样本空间中的其他对象,然后使用人类语言来描述此对象。这样,所有对象都具有的两个基本属性:对象ID和对象描述信息,即任一对象可以被表示为:Object=(ID,description)。基于该认知模型的信息处理主要包括:1)建立对象样本空间。2)通过人工/自动编码方式为对象样本空间中的每个对象提供编码值标识该对象的唯一ID,并保存该对象的人类语言描述信息。3)根据信息处理逻辑,使用{Object=(ID,description)}信息参与各种信息运算。数据库在处理数据时,也正是基于上述认知模型的。以商用数据库为例,它通常使用字典表对各种字符串/文本进行编码/解码,然后参与各种查询运算。具体地,若数据库对源数据文件某一列采用字典表,则这一列的数据就构成了一个对象样本空间。导入数据时,数据库会选择相应的编码算法,对该列中每一个对象进行编码,生成唯一标识ID并保存到数据表的物理文件中。源数据文件中,该列提供的其他数据即对应于该列对象的描述信息。此外,该表拥有一个私有的字典表,存储了该列对象的映射信息,用于解码。比如对源数据文件中“支行名称”列进行编码得到的编码值(对象ID)如下:对象ID支行名称(描述)0001XX银行(A支行)0002XX银行(B支行)0 ...
【技术保护点】
1.一种对数据库中的对象编码的方法,其特征在于,包括:根据所述数据库中多个对象样本空间的相关性,确定全局对象样本空间;基于所述全局对象样本空间创建全局字典表,所述全局字典表包含所述全局对象样本空间内每一个对象的对象标识ID和对象描述信息,所述每一个对象的对象标识在所述全局对象样本空间内唯一,所述全局字典表中对象ID与对象的描述信息为一一映射关系,且所述全局字典表提供有编码接口;调用所述全局字典表的所述编码接口对所述数据库中的至少一个对象进行编码,以得到所述至少一个对象的编码值,所述至少一个对象的编码值为所述至少一个对象的对象ID。
【技术特征摘要】
1.一种对数据库中的对象编码的方法,其特征在于,包括:根据所述数据库中多个对象样本空间的相关性,确定全局对象样本空间;基于所述全局对象样本空间创建全局字典表,所述全局字典表包含所述全局对象样本空间内每一个对象的对象标识ID和对象描述信息,所述每一个对象的对象标识在所述全局对象样本空间内唯一,所述全局字典表中对象ID与对象的描述信息为一一映射关系,且所述全局字典表提供有编码接口;调用所述全局字典表的所述编码接口对所述数据库中的至少一个对象进行编码,以得到所述至少一个对象的编码值,所述至少一个对象的编码值为所述至少一个对象的对象ID。2.根据权利要求1所述的方法,其特征在于,所述数据库中的同一类对象构成一个对象样本空间,所述对象包括:元组。3.根据权利要求1或2所述的方法,其特征在于,所述根据所述数据库中多个对象样本空间的相关性,确定全局对象样本空间包括:确定所述数据库中具有相关性的至少两列,所述至少两列构成所述全局对象样本空间。4.根据权利要求3所述的方法,其特征在于,所述具有相关性的至少两列包括:在查询运算时会被同时操作的至少两列。5.根据权利要求1至4任一项所述的方法,其特征在于,所述全局字典表提供操作接口,所述方法还包括:调用所述操作接口对所述全局字典表进行操作,所述操作包括:查询、更新、删除、分区或导入操作中的至少一种。6.根据权利要求1至5任一项所述的方法,其特征在于,所述全局字典表为数据文件、内存表、数据库表或索引表中的一种。7.一种数据库查询运算的方法,其特征在于,包括:接收客户端发送的结构化查询语言SQL语句,处理该SQL语句以生成执行计划;所述SQL语句用于请求对数据库中的至少一个对象进行查询运算;提取存储的所述至少一个对象的对象标识ID;其中,所述对象的对象标识是通过调用全局字典表的编码接口对所述至少一个对象进行编码后得到并存储在数据存储器中的;所述全局字典表包含全局对象样本空间内每一个对象的对象ID和对象描述信息,所述每一个对象的对象标识在所述全局对象样本空间内唯一,所述全局字典表中对象ID与对象的描述信息为一一映射关系;所述全局对象样本空间是由所述数据库中具有相关性多个对象样本空间构成的;根据所述执行计划,直接使用所述至少一个对象的对象ID进行所述查询运算,以生成查询结果,并将所述查询结果返回给所述客户端。8.根据权利要求7所述的方法,其特征在于,所述数据库中的同一类对象构成一个对象样本空间,所述对象包括:元组。9.根据权利要求7或8所述的方法,其特征在于,所述具有相关性多个对象样本空间包括:所述数据库中具有相关...
【专利技术属性】
技术研发人员:刘辉军,孟聪,张朝威,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。