直方图的处理方法、装置与计算机可读存储介质制造方法及图纸

技术编号:34338453 阅读:53 留言:0更新日期:2022-07-31 03:26
本申请提供了一种直方图的处理方法、装置与计算机可读存储介质。该方法包括:将原始直方图的各区间划分为多个子区间;获取增量数据,且将增量数据填充至对应的子区间中,使得至少部分子区间中的数据的个数发生变化,得到更新后的子区间;对更新后的子区间进行组合,得到更新后的直方图,更新后的直方图与原始直方图的区间个数相同。本方案通过划分小区间的方式实现了对增量数据的快速处理。方式实现了对增量数据的快速处理。方式实现了对增量数据的快速处理。

【技术实现步骤摘要】
直方图的处理方法、装置与计算机可读存储介质


[0001]本申请涉及直方图分析领域,具体而言,涉及一种直方图的处理方法、装置、计算机可读存储介质与处理器。

技术介绍

[0002]现有的直方图分析方法,对于增量数据的分析是在原有的数据分区上对新增数据进行合并,然后构造一个与原直方图近似的等宽直方图,处理速度较慢。

技术实现思路

[0003]本申请的主要目的在于提供一种直方图的处理方法、装置、计算机可读存储介质与处理器,以解决现有技术中直方图处理增量数据的方法处理速度较慢的问题。
[0004]为了实现上述目的,根据本申请的一个方面,提供了一种直方图的处理方法,包括:将原始直方图的各区间划分为多个子区间;获取增量数据,且将所述增量数据填充至对应的所述子区间中,使得至少部分所述子区间中的数据的个数发生变化,得到更新后的子区间;对所述更新后的子区间进行组合,得到更新后的直方图,所述更新后的直方图与所述原始直方图的区间个数相同。
[0005]可选地,对所述更新后的子区间进行组合,得到更新后的直方图,包括:将所述原始直方图的各所述区间对应的多个所述更新后的子区间,组合成更新后的区间;采用多个所述更新后的区间,构成所述更新后的直方图。
[0006]可选地,对所述更新后的子区间进行组合,得到更新后的直方图,包括:获取各所述更新后的子区间的数据量;计算所有的所述更新后的子区间的数据量的总和,得到总数据量;按照数据从小到大的顺序,将所述总数据量划分为N等份,得到所述更新后的直方图,其中,N等于所述原始直方图的所述区间个数。
[0007]可选地,获取各所述更新后的子区间的数据量,包括:构建计数器组件;采用所述计数器组件获取各所述更新后的子区间的数据量。
[0008]可选地,将原始直方图的各区间划分为多个子区间,包括:获取所述原始直方图的各所述区间的宽度和各所述区间内的数据量;根据各所述区间的宽度和各所述区间内的数据量,确定各所述区间对应的所述子区间的个数;依据各所述区间对应的所述子区间的个数,按照数据由小到大的顺序,将原始直方图的各区间划分为多个所述子区间。
[0009]可选地,将所述增量数据填充至对应的所述子区间中,包括:获取所述增量数据的数值大小;获取各所述子区间的最小值和最大值;根据所述增量数据的数值大小、各所述子区间的最小值和各所述子区间的最大值,确定所述增量数据所在的子区间;将所述增量数据填充至对应的所述子区间中。
[0010]可选地,所述原始直方图用于表示存量数据的分布。
[0011]根据本申请的另一个方面,提供了一种直方图的处理装置,包括:划分单元,用于将原始直方图的各区间划分为多个子区间;处理单元,用于获取增量数据,且将所述增量数
据填充至对应的所述子区间中,使得至少部分所述子区间中的数据的个数发生变化,得到更新后的子区间;组合单元,用于对所述更新后的子区间进行组合,得到更新后的直方图,所述更新后的直方图与所述原始直方图的区间个数相同。
[0012]根据本申请的又一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行任意一种所述的方法。
[0013]根据本申请的再一个方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行任意一种所述的方法。
[0014]应用本申请的技术方案,通过首先将原始直方图的各区间划分为多个子区间,然后获取增量数据,且将上述增量数据填充至对应的上述子区间中,使得至少部分上述子区间中的数据的个数发生变化,得到更新后的子区间;最后对上述更新后的子区间进行组合,得到更新后的直方图,上述更新后的直方图与上述原始直方图的区间个数相同。即通过划分小区间的方式实现了对增量数据的快速处理。
附图说明
[0015]构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0016]图1示出了根据本申请的实施例的一种直方图的处理方法流程图;
[0017]图2示出了根据本申请的实施例的一种直方图的处理装置示意图。
具体实施方式
[0018]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0019]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
[0020]需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0021]应该理解的是,当元件(诸如层、膜、区域、或衬底)描述为在另一元件“上”时,该元件可直接在该另一元件上,或者也可存在中间元件。而且,在说明书以及权利要求书中,当描述有元件“连接”至另一元件时,该元件可“直接连接”至该另一元件,或者通过第三元件“连接”至该另一元件。
[0022]为了便于描述,以下对本申请实施例涉及的部分名词或术语进行说明:
[0023]直方图:又称质量分布图,是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布情况。一般用横轴表示数据类型,纵轴表示分布情况。为了构建直方图,第一步是将值的范围分段,即将整个值的范围分为一系列间隔,然后计算每个间隔中有多少值。这些值通常被指定为连续的,不重叠的变量间隔。间隔必须相邻,并且通常是(但不是必须的)相等的大小。
[0024]根据本申请的实施例,提供了一种直方图的处理方法。
[0025]图1是根据本申请实施例的直方图的处理方法的流程图。如图1所示,该方法包括以下步骤:
[0026]步骤S101,将原始直方图的各区间划分为多个子区间;
[0027]具体地,原始直方图的一个区间指的就是一个条形柱对应的宽度,例如,第二个条形柱对应的宽度是[5,10]。本方案的思路就是先把大的区间划分为更小的区间,例如将[5,10]划分为成[5,6](6,7](7,8](8,9](9,10]。
[0028]步骤S102,获取增量数据,且将上述增量数据填充至对应的上述子区间中,使得至少部分上述子区间中的数据的个数发生变化,得到更新后的子区间;
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种直方图的处理方法,其特征在于,包括:将原始直方图的各区间划分为多个子区间;获取增量数据,且将所述增量数据填充至对应的所述子区间中,使得至少部分所述子区间中的数据的个数发生变化,得到更新后的子区间;对所述更新后的子区间进行组合,得到更新后的直方图,所述更新后的直方图与所述原始直方图的区间个数相同。2.根据权利要求1所述的方法,其特征在于,对所述更新后的子区间进行组合,得到更新后的直方图,包括:将所述原始直方图的各所述区间对应的多个所述更新后的子区间,组合成更新后的区间;采用多个所述更新后的区间,构成所述更新后的直方图。3.根据权利要求1所述的方法,其特征在于,对所述更新后的子区间进行组合,得到更新后的直方图,包括:获取各所述更新后的子区间的数据量;计算所有的所述更新后的子区间的数据量的总和,得到总数据量;按照数据从小到大的顺序,将所述总数据量划分为N等份,得到所述更新后的直方图,其中,N等于所述原始直方图的所述区间个数。4.根据权利要求3所述的方法,其特征在于,获取各所述更新后的子区间的数据量,包括:构建计数器组件;采用所述计数器组件获取各所述更新后的子区间的数据量。5.根据权利要求1所述的方法,其特征在于,将原始直方图的各区间划分为多个子区间,包括:获取所述原始直方图的各所述区间的宽度和各所述区间内的数据量;根据各所述区间的宽度和各所述区间内的数据量,确定...

【专利技术属性】
技术研发人员:郝冰陈震宇刘国华李少波
申请(专利权)人:中国邮政储蓄银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1