一种分布式数据库多列复合查询的系统及方法技术方案

技术编号：9765921 阅读：137 留言：0更新日期：2014-03-15 11:43

本申请公开一种分布式数据库多列复合查询的系统及方法，由存储子系统、索引子系统、线性序列生成器、入库模块、查询模块组成。在数据入库建立索引时，为每一条数据记录生成一个单调递增序列值，将索引字段的值和单调递增序列值组合作为索引表的行键；索引扫描时，返回结果按行键顺序排序，执行效率较高，且占用系统资源较少；并且，索引键值的查询、索引结果的合并、查找存储子系统可以并发执行，大大提高了查询响应的速度。

全部详细技术资料下载

【技术实现步骤摘要】

本申请属于信息
，尤其涉及。
技术介绍
当前很多行业，每天都在产生大量的数据，随着技术和业务的发展，数据产生的速度不断加快，数据量不断膨胀。对于这种海量数据集，要进行存储并从中快速的查找需要的数据，传统的数据库已经不太适合，于是诞生了各种分布式数据库。在大规模的数据管理中，影响数据查询速度的关键因素在于需要访问的数据量和磁盘10。索引技术是数据库实践中提高查询性能的重要方法。目前常见的分布式数据库系统中，针对多列查询，即查询条件中包括多个索引键值的查询，通常有如下几种处理方式:1.依据各个索引键值分别做索引查询，得到一系列结果集，然后根据各个索引键值之间的逻辑关系，对各结果集取交集或取并集，最终得到一个没有重复的结果集。合并时需要依次查找每个结果集中的每条结果是否存在于其他结果集之中，为提高合并效率，通常又有两种具体实现方式:a)对各结果集进行排序，对排序后的结果集再做合并；b)将各结果集的值存入HASH容器中，提高查找速度。2.从多个索引键值中，选取一个选择性比较高的做索引查询，得到一个结果集，扫描此结果集内的全部数据，使用查询条件中其他未做索引查询的索引键值对这些数据做过滤，得到最终的查询结果集。比如下面的查询:select氺from user_info where username = iCC9 and sex = ‘male’，单独根据username查找得到的结果数比较少，即username列的选择性比较高,于是只根据username = ‘CC’这一条件做查找,遍历其结果集,将其中满足条件sex = ‘male’的结果返回给...

【技术保护点】
一种分布式数据库多列复合查询的系统，其特征在于：由存储子系统、索引子系统、线性序列生成器、入库模块、查询模块组成。

【技术特征摘要】
1.一种分布式数据库多列复合查询的系统，其特征在于:由存储子系统、索引子系统、线性序列生成器、入库模块、查询模块组成。2.如权利要求1所述的一种分布式数据库多列复合查询的系统，其特征在于:存储子系统采用分布式文件系统，索引子系统采用分布式列存储数据库，查询模块包括查询解析模块、索引查询模块和原始数据扫描模块。3.一种分布式数据库多列复合查询的方法，其特征在于:在数据入库建立索引时，为每一条数据记录生成一个单调递增序列值，将索引字段的值和单调递增序列值组合作为索引表的行键；索引扫描时，返回结果按行键顺序排序。4.如权利要求3所述的一种分布式数据库多列复合查询的方法，其特征在于:如果原始记录中已经存在一个字段的值满足单调递增条件且都不为空，则可以直接使用该字段的值做为序列值。5.如权利要求3所述的一种分布式数据库多列复合查询的方法，其...

【专利技术属性】
技术研发人员：孙杰，阎星娥，赵万亮，杨昆，
申请(专利权)人：烽火通信科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人