The embodiment of the present invention provides an index optimization method and device based on T_tree. The method includes: acquiring data blocks containing batch data, the data amount of the data blocks is determined by the amount of data saved by index nodes in T_tree, in which the index information of the index nodes includes the amount of data saved by the index nodes, and according to the maximum number of data blocks. A new index node is generated by comparing the maximum value with the minimum value of the index value in the index information and the first preset rule. According to the new index node and the second preset rule, the new index node is incorporated into the original index. The device performs the above method. The index optimization method and device based on T tree provided by the embodiment of the present invention optimizes the original index in the scene of mass insertion of data, and can improve the response speed of T tree index.
【技术实现步骤摘要】
一种基于T-树的索引优化方法及装置
本专利技术实施例涉及数据索引
,具体涉及一种基于T-树的索引优化方法及装置。
技术介绍
索引用于在数据查询时提高效率,随着海量数据的产生,对索引技术提出了新的挑战。现有技术T-tree(T-树)索引在这种场景下,采用将每一条数据插入索引,由于每一条数据的插入,都需要进行二叉树节点的判断,尤其是待插入的数据量很大,响应速度性能极其低下。因此,如何在大批量插入数据的场景下,提高T-树索引的响应速度,成为亟须解决的问题。
技术实现思路
针对现有技术存在的问题,本专利技术实施例提供一种基于T-树的索引优化方法及装置。第一方面,本专利技术实施例提供一种基于T-树的索引优化方法,所述方法包括:获取包含有批量数据的数据块,所述数据块的数据量根据T-树中的索引节点保存的数据量所确定,其中,所述索引节点的索引信息包括所述索引节点保存的数据量;根据所述数据块的最大数值和最小数值与所述索引信息中的索引数值的最大值和最小值的比较结果、以及第一预设规则,生成新的索引节点;根据所述新的索引节点和第二预设规则,将所述新的索引节点融入到原始索引中。第二方面,本专利技术实施例提供一种基于T-树的索引优化装置,所述装置包括:获取单元,用于获取包含有批量数据的数据块,所述数据块的数据量根据T-树中的索引节点保存的数据量所确定,其中,所述索引节点的索引信息包括所述索引节点保存的数据量;生成单元,用于根据所述数据块的最大数值和最小数值与所述索引信息中的索引数值的最大值和最小值的比较结果、以及第一预设规则,生成新的索引节点;融入单元,用于根据所述新的索引节点和第 ...
【技术保护点】
1.一种基于T‑树的索引优化方法,其特征在于,包括:获取包含有批量数据的数据块,所述数据块的数据量根据T‑树中的索引节点保存的数据量所确定,其中,所述索引节点的索引信息包括所述索引节点保存的数据量;根据所述数据块的最大数值和最小数值与所述索引信息中的索引数值的最大值和最小值的比较结果、以及第一预设规则,生成新的索引节点;根据所述新的索引节点和第二预设规则,将所述新的索引节点融入到原始索引中。
【技术特征摘要】
1.一种基于T-树的索引优化方法,其特征在于,包括:获取包含有批量数据的数据块,所述数据块的数据量根据T-树中的索引节点保存的数据量所确定,其中,所述索引节点的索引信息包括所述索引节点保存的数据量;根据所述数据块的最大数值和最小数值与所述索引信息中的索引数值的最大值和最小值的比较结果、以及第一预设规则,生成新的索引节点;根据所述新的索引节点和第二预设规则,将所述新的索引节点融入到原始索引中。2.根据权利要求1所述的方法,其特征在于,所述索引信息还包括批量数据缓冲区;相应的,所述根据所述数据块的最大数值和最小数值与所述索引信息中的索引数值的最大值和最小值的比较结果、以及第一预设规则,生成新的索引节点,包括:若所述最大数值和最小数值对应的取值范围包含于所述索引数值的最大值和最小值对应的取值范围之间,则将所述批量数据置于所述批量数据缓冲区中;将所述批量数据缓冲区中的批量数据的数据数值和所述索引数值合并,并对合并后的数值进行排序;将所述索引数值的最小值和所述最大数值之间排序后的第一数值作为生成新的索引节点的索引数值;相应的,将所述批量数据缓冲区中的第一数值复制到所述索引数值的存储空间中。3.根据权利要求1或2所述的方法,其特征在于,所述根据所述数据块的最大数值和最小数值与所述索引信息中的索引数值的最大值和最小值的比较结果、以及第一预设规则,生成新的索引节点,包括:若所述最小数值大于所述索引数值的最小值、且所述最大数值大于所述索引数值的最大值,则获取所述索引节点的右子树键值;若所述右子树键值大于所述最大数值,将所述右子树键值对应的索引节点作为第二索引节点,相应的,获取所述第二索引节点的第二索引数值的最大值和最小值,并将所述索引数值的最小值和所述索引数值的最大值分别作为第一索引数值的最小值和最大值;对所述批量数据进行排序,并将所述第一索引数值的最小值和最大值之间的排序后的批量数据作为第一批量数据,将所述第二索引数值的最小值和最大值之间的排序后的批量数据作为第二批量数据;分别将所述第一批量数据和所述第二批量数据,作为生成新的第一索引节点的第一索引数值和新的第二索引节点的第二索引数值。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:若所述索引节点不存在的右子树,则获取所述索引节点的父索引节点;若所述父索引节点的右子树键值大于所述最大数值,将父索引节点的右子树对应的索引节点作为第二索引节点,相应的,继续执行所述获取所述第二索引节点的第二索引数值的最大值和最小值至所述作为生成新的第一索引节点的第一索引数值和新的第二索引节点的第二索引数值之间的步骤。5.根据权利要求1所述的方法,其特征在于,所述根据所述新的索引节点和第二预设规则,将所...
【专利技术属性】
技术研发人员:汤人杰,时家幸,张式勤,张勇,于祥兵,周勋,杨巧节,
申请(专利权)人:中国移动通信集团浙江有限公司,中移苏州软件技术有限公司,中国移动通信集团公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。