The invention discloses a data query engine based on piecewise storage and half index, which comprises a data generation module, a data sorting module and a data query module. The invention stores all kinds of plaintext data under a specific file based on GPU operation, dynamically sorts the data in each file, and then sorts the plaintext data from small to large based on 21 to 24 bit inversion of MD5 value of each line of plaintext data, finally queries the plaintext data corresponding to the specific MD5 encrypted data based on half index. The invention first effectively alleviates the pressure of data storage in database, only storing plaintext, instead of the plaintext and MD5 storage mode adopted by the original storage method; at the same time, it improves the efficiency of file generation and data storage based on fragmentation technology; and at the same time, it greatly improves the speed of fast positioning and query of file content based on the half-fold query algorithm, and fully displays the data of the half-fold query algorithm. The faster the query speed is, the more the volume is.
【技术实现步骤摘要】
一种基于分片存储和折半索引的数据查询引擎
本专利技术涉及一种数据查询引擎,尤其涉及一种基于分片存储和折半索引的数据查询引擎。
技术介绍
对于传统数据库查询MD5实现方法包含以下两步:第一步:建立数据;1、先在数据库中建立2个表,表名分别为text、MD5;2、将明文和明文生成的MD5同时入库;3、建立索引;第二步:查询数据;1、先遍历索引;2、通过关系型数据库匹配MD5获得明文。此方法同时存储了明文和32位密文,为了便于查询又创建了索引,相比以上只存储明文、通过计算得出索引的方法多占用成倍的空间。同时,对于数据量越大,查询速度也会越来越大,整体效率会大幅下降。
技术实现思路
针对上述现有技术中描述的不足,本专利技术提供一种基于分片存储和折半索引的数据查询引擎,能够实现从MD5加密数据到反向明文的快速定位查询。为解决上述技术问题,本专利技术所采用的技术方案如下:一种基于分片存储和折半索引的数据查询引擎,包括数据生成模块、数据排序模块、数据查询模块。其中,所述数据生成模块,用于将各个MD5加密数据的明文通过分片存放的形式生成于各个文件中,包括MD5加密单元、文件名生成单元和文件夹名生成单元。所述MD5加密单元,用于对明文数据进行MD5加密。所述文件名生成单元,将32位MD5加密数据的第9位至第13位的十六进制转化为十进制,作为文件名。所述文件夹名生成单元,将文件名除以1024去掉余数后作为文件夹名,文件存放于当前文件夹下。所述数据排序模块,对每个文件夹下的明文数据从小到大依次排序,包括数据排序单元,用于将同一文件下每行明文的MD5值的第21位至第24位进行倒序,并 ...
【技术保护点】
1.一种基于分片存储和折半索引的数据查询引擎,其特征在于,包括数据生成模块、数据排序模块、数据查询模块;其中,所述数据生成模块,用于将各个MD5加密数据的明文通过分片存放的形式生成于各个文件中;所述数据排序模块,对每个文件夹下的明文数据从小到大依次排序;所述数据查询模块,基于给定的MD5加密数据进行反向明文查询,并将查询结果输出。
【技术特征摘要】
1.一种基于分片存储和折半索引的数据查询引擎,其特征在于,包括数据生成模块、数据排序模块、数据查询模块;其中,所述数据生成模块,用于将各个MD5加密数据的明文通过分片存放的形式生成于各个文件中;所述数据排序模块,对每个文件夹下的明文数据从小到大依次排序;所述数据查询模块,基于给定的MD5加密数据进行反向明文查询,并将查询结果输出。2.根据权利要求1所述的一种基于分片存储和折半索引的数据查询引擎,其特征在于:所述数据生成模块,包括MD5加密单元、文件名生成单元和文件夹名生成单元;所述MD5加密单元,用于对明文数据进行MD5加密;所述文件名生成单元,将32位MD5加密数据的第9位至第13位的十六进制转化为十进制,作为文件名;所述文件夹名生成单元,将文件名除以1024去掉余数后作为文件夹名,文件存放于当前文件夹下。3.根据权利要求1所述的一种基于分片存储和折半索引的数据查询引擎,其特征在于:所述数据排序模块,包括数据排序单元,用于将同一文件下每行明文的MD5值的第21位至第24位进行倒序,并基于倒序结果按从小到大从上到下的顺序依次排序。4.根据权利要求1所述的一种...
【专利技术属性】
技术研发人员:段俊辉,朱永超,张杨杨,徐受天,
申请(专利权)人:中铁工程装备集团有限公司,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。