数据存储方法及装置、数据查找方法及装置、终端制造方法及图纸

技术编号:38427720 阅读:11 留言:0更新日期:2023-08-07 11:25
一种数据存储方法及装置、数据查找方法及装置、终端,所述方法包括:确定原始数据,所述原始数据包含多个原始索引;依照所述原始索引,对所述原始数据进行排序,以得到多行原始数据;遍历排序后的各行原始数据并进行逐个数据文件划分;对于划分后的每个数据文件,分别遍历各行原始数据并进行逐个数据块划分;为每个数据文件构建二级索引列表;基于各个二级索引列表,构建一级索引列表。本发明专利技术可以提高查找效率和准确性。找效率和准确性。找效率和准确性。

【技术实现步骤摘要】
数据存储方法及装置、数据查找方法及装置、终端


[0001]本专利技术涉及计算机
,尤其涉及一种数据存储方法及装置、数据查找方法及装置、终端。

技术介绍

[0002]随着用户对于通信设备中数据存储系统的容量和读写性能方面的要求不断增强,当前通信设备的数据存储系统往往需要存储海量的数据。
[0003]在现有技术中,通常会对海量数据进行预处理,分成多个数据块后进行存储,在查找某一数据时,就需要对多个数据块进行搜寻,以获得该数据的所有符号,从而还原成原来的数据。
[0004]然而,上述方法耗时较长,导致数据读写效率低,错误率增加。

技术实现思路

[0005]本专利技术解决的技术问题是提供一种数据存储方法及装置、数据查找方法及装置、终端,可以在保持存储空间不变的情况下有效提高查找效率和准确性,还可以在维持查找效率的情况下采用成本较低的存储介质,且提高查找准确性。
[0006]为解决上述技术问题,本专利技术实施例提供一种数据存储方法,包括:确定原始数据,所述原始数据包含多个原始索引,每个原始索引用于指示单个完整数据且具有一个或多个原始值;依照所述原始索引,对所述原始数据进行排序,以得到多行原始数据,每行原始数据包含原始索引和原始值;遍历排序后的各行原始数据并进行逐个数据文件划分,其中,每相邻的两个数据文件中,前一个数据文件的最后一行原始数据的原始索引与后一个数据文件的第一行原始数据的原始索引不同;对于划分后的每个数据文件,分别遍历各行原始数据并进行逐个数据块划分,其中,每相邻的两个数据块中,前一个数据块的最后一行原始数据的原始索引与后一个数据块的第一行原始数据的原始索引不同;为每个数据文件构建二级索引列表,每个二级索引列表具有多行二级索引信息,其中,每行二级索引信息用于表示一个或多个数据块;基于各个二级索引列表,构建一级索引列表,其中,所述一级索引列表具有多行一级索引信息,其中,每行一级索引信息用于表示一个或多个数据文件。
[0007]可选的,所述遍历排序后的各行原始数据并进行逐个数据文件划分,包括:每当达到第一预设行数时,如果后一行原始数据的原始索引与当前行原始数据的原始索引不同,则采用所述第一预设行数的原始数据作为单个数据文件,否则后延,直至后一行原始数据的原始索引与当前行原始数据的原始索引不同时,采用所述第一预设行数的原始数据以及后延的原始数据之和作为单个数据文件。
[0008]可选的,遍历各行原始数据并进行逐个数据块划分,包括:每当达到第二预设行数时,如果后一行原始数据的原始索引与当前行原始数据的原始索引不同,则采用所述第二预设行数的原始数据作为单个数据块,否则后延,直至后一行原始数据的原始索引与当前行原始数据的原始索引不同时,采用所述第二预设行数的原始数据以及后延的原始数据之
和作为单个数据块;其中,所述第二预设行数小于第一预设行数。
[0009]可选的,每行二级索引信息包含对应的各个数据块的原始数据开始行号和结束行号、对应的各个数据块的最小原始索引和最大原始索引。
[0010]可选的,每行一级索引信息包含二级索引序号、对应的数据文件的二级索引信息的开始行号和结束行号、对应的数据文件的二级索引信息的最小原始索引和最大原始索引;其中,所述二级索引序号与二级索引列表具有一一对应关系。
[0011]为解决上述技术问题,本专利技术实施例提供一种基于上述的数据存储方法的数据查找方法,包括:采用待查找的原始索引,查找所述一级索引列表,确定待查找的二级索引列表;采用所述待查找的原始索引,查找确定的二级索引列表,确定待查找的数据块;采用所述待查找的原始索引,查找确定的数据块,以确定所述待查找的原始索引的原始值。
[0012]可选的,每行一级索引信息包含二级索引序号、对应的数据文件的二级索引信息的开始行号和结束行号、对应的数据文件的二级索引信息的最小原始索引和最大原始索引;采用待查找的原始索引,查找所述一级索引列表,确定待查找的二级索引列表,包括:根据各个数据文件的最小原始索引和最大原始索引,确定所述待查找的原始索引在所述一级索引列表的行号;基于所述待查找的原始索引在所述一级索引列表的行号,和各个数据文件的开始行号和结束行号,确定所述待查找的原始索引对应的二级索引信息;基于所述二级索引信息,确定所述二级索引信息对应的数据文件的二级索引列表。
[0013]可选的,每行二级索引信息包含对应的各个数据块的原始数据开始行号和结束行号、对应的各个数据块的最小原始索引和最大原始索引;采用所述待查找的原始索引,查找确定的二级索引列表,确定待查找的数据块,包括:根据各个数据块的最小原始索引和最大原始索引,确定所述待查找的原始索引在所述二级索引列表的行号;基于所述二级索引列表的行号,确定待查找的数据文件;在确定的数据文件中,基于各个数据块的开始行号和结束行号,确定所述待查找的数据块。
[0014]为解决上述技术问题,本专利技术实施例提供一种数据存储装置,包括:原始数据确定模块,用于确定原始数据,所述原始数据包含多个原始索引,每个原始索引用于指示单个完整数据且具有一个或多个原始值;排序模块,用于依照所述原始索引,对所述原始数据进行排序,以得到多行原始数据,每行原始数据包含原始索引和原始值;文件划分模块,用于遍历排序后的各行原始数据并进行逐个数据文件划分,其中,每相邻的两个数据文件中,前一个数据文件的最后一行原始数据的原始索引与后一个数据文件的第一行原始数据的原始索引不同;块划分模块,用于对于划分后的每个数据文件,分别遍历各行原始数据并进行逐个数据块划分,其中,每相邻的两个数据块中,前一个数据块的最后一行原始数据的原始索引与后一个数据块的第一行原始数据的原始索引不同;二级列表构建模块,用于为每个数据文件构建二级索引列表,每个二级索引列表具有多行二级索引信息,其中,每行二级索引信息用于表示一个或多个数据块;一级列表构建模块,用于基于各个二级索引列表,构建一级索引列表,其中,所述一级索引列表具有多行一级索引信息,其中,每行一级索引信息用于表示一个或多个数据文件。
[0015]为解决上述技术问题,本专利技术实施例提供一种基于上述的数据存储装置的数据查找装置,包括:二级列表确定模块,用于采用待查找的原始索引,查找所述一级索引列表,确定待查找的二级索引列表;数据块确定模块,用于采用所述待查找的原始索引,查找确定的
二级索引列表,确定待查找的数据块;原始值确定模块,用于采用所述待查找的原始索引,查找确定的数据块,以确定所述待查找的原始索引的原始值。
[0016]为解决上述技术问题,本专利技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时执行上述数据存储方法的步骤,或者执行上述数据查找方法的步骤。
[0017]为解决上述技术问题,本专利技术实施例提供一种终端,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行上述数据存储方法的步骤,或者执行上述数据查找方法的步骤。
[0018]与现有技本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据存储方法,其特征在于,包括:确定原始数据,所述原始数据包含多个原始索引,每个原始索引用于指示单个完整数据且具有一个或多个原始值;依照所述原始索引,对所述原始数据进行排序,以得到多行原始数据,每行原始数据包含原始索引和原始值;遍历排序后的各行原始数据并进行逐个数据文件划分,其中,每相邻的两个数据文件中,前一个数据文件的最后一行原始数据的原始索引与后一个数据文件的第一行原始数据的原始索引不同;对于划分后的每个数据文件,分别遍历各行原始数据并进行逐个数据块划分,其中,每相邻的两个数据块中,前一个数据块的最后一行原始数据的原始索引与后一个数据块的第一行原始数据的原始索引不同;为每个数据文件构建二级索引列表,每个二级索引列表具有多行二级索引信息,其中,每行二级索引信息用于表示一个或多个数据块;基于各个二级索引列表,构建一级索引列表,其中,所述一级索引列表具有多行一级索引信息,其中,每行一级索引信息用于表示一个或多个数据文件。2.根据权利要求1所述的方法,其特征在于,所述遍历排序后的各行原始数据并进行逐个数据文件划分,包括:每当达到第一预设行数时,如果后一行原始数据的原始索引与当前行原始数据的原始索引不同,则采用所述第一预设行数的原始数据作为单个数据文件,否则后延,直至后一行原始数据的原始索引与当前行原始数据的原始索引不同时,采用所述第一预设行数的原始数据以及后延的原始数据之和作为单个数据文件。3.根据权利要求2所述的方法,其特征在于,遍历各行原始数据并进行逐个数据块划分,包括:每当达到第二预设行数时,如果后一行原始数据的原始索引与当前行原始数据的原始索引不同,则采用所述第二预设行数的原始数据作为单个数据块,否则后延,直至后一行原始数据的原始索引与当前行原始数据的原始索引不同时,采用所述第二预设行数的原始数据以及后延的原始数据之和作为单个数据块;其中,所述第二预设行数小于第一预设行数。4.根据权利要求1至3任一项所述的方法,其特征在于,每行二级索引信息包含对应的各个数据块的原始数据开始行号和结束行号、对应的各个数据块的最小原始索引和最大原始索引。5.根据权利要求1所述的方法,其特征在于,每行一级索引信息包含二级索引序号、对应的数据文件的二级索引信息的开始行号和结束行号、对应的数据文件的二级索引信息的最小原始索引和最大原始索引;其中,所述二级索引序号与二级索引列表具有一一对应关系。6.一种基于权利要求1至5任一项所述的数据存储方法的数据查找方法,其特征在于,包括:采用待查找的原始索引,查找所述一级索引列表,确定待查找的二级索引列表;采用所述待查找的原始索引,查找确定的二级索引列表,确定待查找的数据块;
采用所述待查找的原始索引,查找确定的数据块,以确定所述待查找的原始索引的原始值。7.根据权利要求6所述的方法,其特征在于,每行一级索引信息包含二级索引序号、对应的数据文件的二级索引信息的开始行号和结束行号、对应的数据文件的二级索引信息的最小原始索引和最大原始索引;采用待查找的原始索引,查找所述一级索...

【专利技术属性】
技术研发人员:陈铖宋向平
申请(专利权)人:杭州数云信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1