基于草图技术的数据库信息统计方法及装置制造方法及图纸

技术编号:33034114 阅读:30 留言:0更新日期:2022-04-15 09:11
本公开提供了一种基于草图技术的数据库信息统计方法,涉及数据库技术领域。所述方法包括:基于草图技术定义数据库中的第一数据表;所述第一数据表为预设时间内数据更新次数大于阈值次数的数据表;获取所述第一数据表的增量数据集;基于草图算法对所述增量数据集进行计算,获取统计信息;所述统计信息包括:增量数据集中每个数据的哈希值以及每个哈希值的出现频率;根据统计信息中每个哈希值的出现频率更新统计信息的直方图;当进行结构化查询语言查询时,根据所述统计信息选取最优执行计划。采用本方法,能够实时更新数据库的统计信息,从而降低更新统计信息时对系统性能造成的影响。影响。影响。

【技术实现步骤摘要】
基于草图技术的数据库信息统计方法及装置


[0001]本公开涉及数据库
,尤其涉及一种基于草图技术的数据 库信息统计方法及装置。

技术介绍

[0002]数据库能否高效的执行计划依赖于数据库系统对每个数据表采样 计算得到的统计信息,如果这些统计信息不准确或者比较陈旧,则可 能导致结构化查询语言(Structured Query Language,简称SQL)查询 的执行效率很差。
[0003]相关技术中,数据库系统为提高统计信息的准确性提出了许多解 决方式,如多为直方图,动态抽样,统计信息自调优等。这些方式在 特定的场景下都能一定程度减少统计信息的偏差,但是不能保证统计 信息的完全准确,且这些统计方式均为静态的统计方式,同时由于要 对直方图进行重新采样和调整计算,需要耗费一定的性能,所以,手 动触发或间隔一段时间触发,不能实时的反应出数据的变化。这些传 统的统计方式比较适用于联机分析处理(Online Analytical Processing, 简称OLAP)这种数据量大且变化频率不高的场景,对于联机事务处理 (Online Tra本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于草图技术的数据库信息统计方法,其特征在于,所述方法包括:基于草图技术定义数据库中的第一数据表;所述第一数据表为预设时间内数据更新次数大于阈值次数的数据表;获取所述第一数据表的增量数据集;基于草图算法对所述增量数据集进行计算,获取统计信息;所述统计信息包括:增量数据集中每个数据的哈希值以及每个哈希值的出现频率;根据统计信息中每个哈希值的出现频率更新统计信息的直方图;当进行结构化查询语言查询时,根据所述统计信息选取最优执行计划。2.根据权利要求1所述的方法,其特征在于,所述获取所述第一数据表的增量数据集,包括:当所述第一数据表插入数据时,获取所述第一数据表的增量数据集;当所述第一数据表更新数据时,获取所述第一数据表的增量数据集;当所述第一数据表删除数据时,获取所述第一数据表的增量数据集。3.根据权利要求1至2中任一项所述的方法,其特征在于,所述获取所述第一数据表的增量数据集,包括:以列为单位获取所述第一数据表中每列数据对应的增量数据集。4.根据权利要求3所述的方法,其特征在于,所述以列为单位获取所述第一数据表中每列数据对应的增量数据集,包括:当多个进程对所述第一数据表中的同一列进行修改时,按照事务提交成功的顺序将多个修改合并为一个增量数据集;或者;当多个线程对所述第一数据表中的同一列进行修改时,按照事务提交成功的顺序将多个修改合并为一个增量数据集。5.根据权利要求1所述的方法,其特征在于,所述基于草图算法计算,获取统计信息,包括:根据哈希算法计算增量数据集中的每个数据对应的哈希值;...

【专利技术属性】
技术研发人员:范国腾尹强
申请(专利权)人:北京人大金仓信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1