一种基于分布式数据库的最值信息提取方法和相关设备技术

技术编号:36083166 阅读:11 留言:0更新日期:2022-12-24 10:57
本发明专利技术公开了一种基于分布式数据库的最值信息提取方法和相关设备,方法包括:获取提取指令,其中,所述提取指令包括最值类型、源数据表信息和第一目标属性;根据所述源数据表信息对应的源数据表的表头,生成空数据表;根据所述第一目标属性,对所述源数据表进行排序,得到初始数据表;根据所述最值类型,确定所述初始数据表中的目标数据;基于预设的忽略指令,将所述目标数据插入所述空数据表,得到与所述提取指令对应的目标数据表。本发明专利技术能够在分布式数据库中,不仅将最值本身提取,还能够显示最值所在数据的其他信息。显示最值所在数据的其他信息。显示最值所在数据的其他信息。

【技术实现步骤摘要】
一种基于分布式数据库的最值信息提取方法和相关设备


[0001]本专利技术涉及数据处理
,特别涉及一种基于分布式数据库的最值信息提取方法和相关设备。

技术介绍

[0002]随着互联网技术的发展,网络中存储的数据量越来越多,单节点的数据库已经难以满足大多数用户的需求,在此基础上,多节点的分布式结构化数据库有了越来越多的应用。多节点的分布式数据库能够存储更多的数据量,且多个子数据库相互协作,实现数据的存储和调用。
[0003]在分布式数据库中,由于同一类型的数据的数量过多,会由两个或两个以上的子数据库存储。而对同一类型的数据,若采用分组统计,提取这些数据中的最大值或最小值无法通过单节点数据库中常用的“group by”指令得到结果。此外,由于数据节点存储和提取的特性,在提取最大值或最小值时,其会将同一个表中不同行的分组字段和非分组字段作为结果集的同一行输出,因此,在分布式数据库中,无法获取分组的最大值或最小值所在行的信息。

技术实现思路

[0004]本专利技术要解决的技术问题在于在多节点的分布式结构化数据库中,无法获取分组的最大(小)行的信息,针对现有技术的不足,提供一种基于分布式数据库的最值信息提取方法和相关设备。
[0005]为了解决上述技术问题,本专利技术所采用的技术方案如下:
[0006]一种基于分布式数据库的最值信息提取方法,所述方法包括:
[0007]获取提取指令,其中,所述提取指令包括最值类型、源数据表信息和第一目标属性;
[0008]根据所述源数据表信息对应的源数据表的表头,生成空数据表;
[0009]根据所述第一目标属性,对所述源数据表进行排序,得到初始数据表;
[0010]根据所述最值类型,确定所述初始数据表中的目标数据;
[0011]基于预设的忽略指令,将所述目标数据插入所述空数据表,得到与所述提取指令对应的目标数据表。
[0012]所述基于分布式数据库的最值信息提取方法,其中,所述提取指令还包括分组属性;所述根据所述源数据表信息对应的源数据表的表头,生成空数据表之前,还包括:
[0013]根据所述分组属性,生成所述源数据表中每一个分组属性值对应的分组标签;
[0014]根据所述源数据表的表头,生成中间数据表;
[0015]针对每一个所述分组标签,将源数据表中与该分组标签对应的数据迁移至所述中间数据表数据,得到与该分组标签对应的源数据子表。
[0016]所述基于分布式数据库的最值信息提取方法,其中,所述根据所述分组属性,生成
所述源数据表中每一个分组属性值对应的分组标签包括:
[0017]针对所述源数据表中的每一行数据,对该行数据的分组属性对应的分组属性值进行哈希计算,得到该行数据对应的分组标签。
[0018]所述基于分布式数据库的最值信息提取方法,其中,所述提取指令还包括第二目标属性;所述根据所述源数据表信息对应的源数据表的表头,生成空数据表包括:
[0019]根据所述源数据表的表头和所述第二目标属性,生成模板表头;
[0020]根据所述模板表头,生成数量与所述源数据子表的数量相同的空数据表。
[0021]所述基于分布式数据库的最值信息提取方法,其中,所述初始数据表包括与所述源数据子表对应的初始数据子表;所述根据所述第一目标属性,对所述源数据表进行排序,得到初始数据表包括:
[0022]针对每一个所述源数据子表,根据所述第一目标属性,对该源数据子表中的数据进行排序,得到与该源数据子表对应的初始数据子表。
[0023]所述基于分布式数据库的最值信息提取方法,其中,所述根据所述最值类型,确定所述初始数据表中的目标数据包括:
[0024]根据所述最值类型,确定所述初始数据表中的目标行;
[0025]根据所述第二目标属性,确定所述目标行中的目标数据。
[0026]所述基于分布式数据库的最值信息提取方法,其中,所述基于预设的忽略指令,将所述目标数据插入所述空数据表,得到与所述提取指令对应的目标数据表包括:
[0027]针对每一个所述初始子表,根据所述忽略指令,将所述初始子表中的目标数据插入所述空数据表中,得到目标数据表。
[0028]一种基于分布式数据库的最值信息提取装置,该装置包括:
[0029]获取模块,用于获取提取指令,其中,所述提取指令包括最值类型、源数据表、第一目标属性和第二目标属性;
[0030]生成模块,用于根据所述源数据表信息对应的源数据表的表头,生成空数据表;
[0031]排序模块,用于根据所述第一目标属性,对所述源数据表进行排序,得到初始数据表;
[0032]确定模块,用于根据所述最值类型,确定所述初始数据表中的目标数据;
[0033]插入模块,用于基于预设的忽略指令,将所述目标数据插入所述空数据表,得到与所述提取指令对应的目标数据表。
[0034]可选地,所述装置还包括分组模块,所述分组模块包括:
[0035]标签单元,用于根据所述分组属性,生成所述源数据表中每一个分组属性值对应的分组标签;
[0036]分组单元,用于根据所述分组标签,对所述源数据表进行数据迁移,得到若干个源数据子表。
[0037]可选地,所述标签单元具体用于:
[0038]针对所述源数据表中的每一行数据,对该行数据的分组属性对应的分组属性值进行哈希计算,得到该行数据对应的分组标签。
[0039]可选地,所述提取指令还包括第二目标属性;所述生成单元具体用于:
[0040]根据所述源数据表的表头和所述第二目标属性,生成模板表头;
[0041]根据所述模板表头,生成数量与所述源数据子表的数量相同的空数据表。
[0042]可选地,所述排序模块具体用于:
[0043]针对每一个所述源数据子表,根据所述第一目标属性,对该源数据子表中的数据进行排序,得到与该源数据子表对应的初始数据子表。
[0044]可选地,所述确定模块具体用于:
[0045]根据所述最值类型,确定所述初始数据表中的目标行;
[0046]根据所述第二目标属性,确定所述目标行中的目标数据。
[0047]可选地,所述插入模块具体用于:
[0048]针对每一个所述初始子表,根据所述忽略指令,将所述初始子表中的目标数据插入所述空数据表中,。
[0049]一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上任一所述的基于分布式数据库的最值信息提取方法中的步骤。
[0050]一种终端设备,其包括:处理器、存储器及通信总线;所述存储器上存储有可被所述处理器执行的计算机可读程序;
[0051]所述通信总线实现处理器和存储器之间的连接通信;
[0052]所述处理器执行所述计算机可读程序时实现如上任一所述的基于分布式数据库的最值信息提取方法本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于分布式数据库的最值信息提取方法,其特征在于,所述方法包括:获取提取指令,其中,所述提取指令包括最值类型、源数据表信息和第一目标属性;根据所述源数据表信息对应的源数据表的表头,生成空数据表;根据所述第一目标属性,对所述源数据表进行排序,得到初始数据表;根据所述最值类型,确定所述初始数据表中的目标数据;基于预设的忽略指令,将所述目标数据插入所述空数据表,得到与所述提取指令对应的目标数据表。2.根据权利要求1所述基于分布式数据库的最值信息提取方法,其特征在于,所述提取指令还包括分组属性;所述根据所述源数据表信息对应的源数据表的表头,生成空数据表之前,还包括:根据所述分组属性,生成所述源数据表中每一个分组属性值对应的分组标签;根据所述源数据表的表头,生成中间数据表;针对每一个所述分组标签,将源数据表中与该分组标签对应的数据迁移至所述中间数据表数据,得到与该分组标签对应的源数据子表。3.根据权利要求2所述基于分布式数据库的最值信息提取方法,其特征在于,所述根据所述分组属性,生成所述源数据表中每一个分组属性值对应的分组标签包括:针对所述源数据表中的每一行数据,对该行数据的分组属性对应的分组属性值进行哈希计算,得到该行数据对应的分组标签。4.根据权利要求2所述基于分布式数据库的最值信息提取方法,其特征在于,所述提取指令还包括第二目标属性;所述根据所述源数据表信息对应的源数据表的表头,生成空数据表包括:根据所述源数据表的表头和所述第二目标属性,生成模板表头;根据所述模板表头,生成数量与所述源数据子表的数量相同的空数据表。5.根据权利要求4所述基于分布式数据库的最值信息提取方法,其特征在于,所述根据所述第一目标属性,对所述源数据表进行排序,得到初始数据表包括:针对每一个所述源数据子表,根据所述第一目标属性,对该源数据子表中的数据进行排序,得到与该源数据子表对应的初始数据子表。6.根据权利要求4所述基于分布式数...

【专利技术属性】
技术研发人员:黄李强熊志强
申请(专利权)人:深圳市汉云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1