【技术实现步骤摘要】
一种获得数据分布时间直方图的统计方法和装置
[0001]本专利技术属于数据统计领域,尤其是涉及一种获得数据分布时间直方图的统计方法和装置。
技术介绍
[0002]统计直方图是一种常用的数据统计图,对某一物理量在相同条件下做n次重复测量,得到一系列测量值,找出它的最大值和最小值,然后确定一个区间,使其包含全部测量数据,将区间分成若干小区间,统计测量结果出现在各小区间的频数M,以测量数据为横坐标,以频数M为纵坐标,划出各小区间及其对应的频数高度,则可得到一个矩形图,即统计直方图。
[0003]对于关系型数据库或者NoSql数据库,统计数据库表中记录的时间直方图是一种常见的需求。时间直方图(date
‑
histogram)是指一定时间范围内,数据库表中每隔某一时间间隔的记录个数;在做大数据分析时,经常需要对有时间字段的记录,做这种时间直方图的统计分析。在很多数据库系统中已经提供了直接的时间直方图支持方法,用户直接调用相关API就可以完成时间直方图的统计。
[0004]但是时间直方图的统计是一个很耗 ...
【技术保护点】
【技术特征摘要】
1.一种获得数据分布时间直方图的统计方法,基于关系型数据库或NoSql数据库,所述数据库中的每条记录包括时间字段,其特征在于,包括以下步骤:步骤S1、创建与索引库一一对应的统计索引库,所述统计索引库以天为时间单位,记录每天的统计结果,所述统计结果的记录截止到当前时间的前一天;所述统计索引库中每条记录的内容包括日期以及与该日期对应的所述索引库中的记录个数;步骤S2、在内存中针对所述索引库创建第一变量和第二变量,所述第一变量为该索引库当天新增记录个数;所述第二变量是该索引库的最后修改时间;步骤S3、进行时间直方图数据分布的统计时,根据统计的时间范围,从统计索引库中获取第一统计结果,或将第一统计结果与所述第一变量及第二变量合并得出第二统计结果。2.根据权利要求1所述的获得数据分布时间直方图的统计方法,其特征在于,还包括:步骤S4、对所述索引库增加一条新记录,具体方法为:在所述索引库中增加记录,并将所述第一变量加一,且将所述第二变量赋值为当前时间。3.根据权利要求2所述的获得数据分布时间直方图的统计方法,其特征在于:在所述步骤S4之前,还包括步骤S401、根据所述第一变量和所述第二变量进行判断,如果所述第一变量不为零,且所述第二变量不为当天,则在执行步骤S4之前,将所述第一变量和第二变量作为一条记录保存到所述统计索引库,并将所述第一变量赋值为零,第二变量赋值为当天的起始时间。4.根据权利要求1所述的获得数据分布时间直方图的统计方法,其特征在于,还包括:步骤S5、对所述索引库删除一条记录,其具体方法为:在所示索引库中删除该记录,并根据该记录中的时间字段,更新所述第一变量或在所述统计索引库中更新对应的所述记录个数。5.根据权利要求1所述的获得数据分布时间直方图的统计方法,其特征在于,还包括:步骤...
【专利技术属性】
技术研发人员:金友兵,宋瑞霞,
申请(专利权)人:南京卓盛云信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。