当前位置: 首页 > 专利查询>湖南大学专利>正文

数据集的中值近似值查找方法、装置和计算机设备制造方法及图纸

技术编号:34459921 阅读:13 留言:0更新日期:2022-08-06 17:17
本申请涉及一种数据集的中值近似值查找方法、装置和计算机设备。所述方法包括:获取当前的待处理数组和预定义的近似中值查找事件的当前状态,根据近似中值查找事件的当前状态,确定待处理数组的均值和标准差,构建累积频率分布表,基于累积频率分布表和上述事件的当前状态,查找出中值近似值所在的数据分组,确定待处理数组的中值近似值,并将均值、标准差、中值近似值以及中值近似值所在的数据分组的位置标识传递给下一数组,若上述事件的当前状态为第一状态,则将第一状态切换为第二状态,返回获取待处理数组和预定义的近似中值查找事件的当前状态的步骤,直至查找出数据集中所有数组的中值近似值。采用本方法能提高近似中值查找效率。中值查找效率。中值查找效率。

【技术实现步骤摘要】
数据集的中值近似值查找方法、装置和计算机设备


[0001]本申请涉及数据查找
,特别是涉及一种数据集的中值近似值查找方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]中值通常是一个数据集合中具有很高价值的统计指标,其比均值更能体现数据集合的平均水平。中值查找是一种旨在从一个未排序的数组中寻找精确中值的方法。快速的中值查找方法能够解决很多领域中所存在的技术难题。具体到应用场景,例如,在降雨量预警的场景中,人们通常是基于如气象雨量传感器采集的数据构成的传感器数据集,查找出传感器数据集的中值所在的近似范围,确定近似中值,然后将近似中值与预设好的预警阈值进行比较,以此做出降雨预警的决策。然而,由于气象雨量传感器的数量很多,且传感器的数据采集过程是持续的,因此,收集到的传感器数据将会是海量的数据,这无疑增加了查找出中值的难度,提高了做出预警决策的难度。因此,提供具备快速查找能力的中值查找方法具有重大意义。
[0003]目前,使用较多的中值查找方法包括全排序查找方法、部分排序查找方法、随机选择算法和近似中值查找算法,全排列查找中值的方法大多通过一种主元选择策略来实现,部分排序查找中值的方法通过维度转换、遗忘选择等策略仅对部分元素进行排序来实现,近似中值查找算法是基于三重调整算法取中值实现。
[0004]然而,面对数据量较大的中值查找任务,上述现有的中值查找方法均会在排序过程中存在大量的数据间的比较操作和交换操作,这些操作会导致时间开销过大,进而降低了中值查找的效率。
专利技术内容
[0005]基于此,有必要针对上述技术问题,提供一种能够提高中值查找效率的数据集的中值近似值查找方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0006]第一方面,本申请提供了一种数据集的中值近似值查找方法,该数据集包括多个数组,多个数组采用同一均值和标准差表征数据分布。所述方法包括:
[0007]获取当前的待处理数组和预定义的近似中值查找事件的当前状态;
[0008]根据预定义的近似中值查找事件的当前状态,确定待处理数组的均值和标准差;
[0009]根据均值和标准差,构建累积频率分布表,累积频率分布表包括多个数据分组,数据分组由待处理数组划分得到;
[0010]基于累积频率分布表和预定义的近似中值查找事件的当前状态,查找出待处理数组的中值近似值所在的数据分组,确定待处理数组的中值近似值,并将均值、标准差、中值近似值以及中值近似值所在的数据分组的位置标识传递给下一数组,若预定义的近似中值查找事件的当前状态为第一状态,则将第一状态切换为第二状态,位置标识用于表征数据分组在完成数据划分后的数组中所处的位置;
[0011]返回获取待处理数组和预定义的近似中值查找事件的当前状态的步骤,直至查找出数据集中所有数组的中值近似值。
[0012]在其中一个实施例中,根据预定义的近似中值查找事件的当前状态,确定待处理数组的均值和标准差包括:
[0013]当预定义的近似中值查找事件的当前状态为第一状态时,则计算待处理数组的均值和标准差;
[0014]当预定义的近似中值查找事件的当前状态为第二状态时,则将接收到的上一数组待处理数组的均值和标准差确定为待处理数组的均值和标准差。
[0015]在其中一个实施例中,基于累积频率分布表和预定义的近似中值查找事件的当前状态,查找出待处理数组的中值近似值所在的数据分组,确定待处理数组的中值近似值包括:
[0016]当预定义的近似中值查找事件的当前状态为第一状态时,则根据累积频率分布表,查找出待处理数组的中值近似值所在的数据分组,确定待处理数组的中值近似值;
[0017]当预定义的近似中值查找事件的当前状态为第二状态时,则根据累积频率分布表,查找出待处理数组的中值近似值所在的数据分组,获取第一数据分组位置标识,当第一数据分组位置标识与第二数据分组位置标识一致时,则将接收到的上一数组的中值近似值确定为待处理数组的中值近似值;
[0018]其中,数据分组位置标识用于表征数据分组在完成数据划分后的数组中所处的位置,第一数据分组位置标识为待处理数组的中值近似值所在的数据分组的位置标识,第二数据分组位置标识为接收到的上一数组的中值近似值所在的数据分组的位置标识。
[0019]在其中一个实施例中,获取第一数据分组位置标识之后,还包括:
[0020]若第一数据分组位置标识与第二数据分组位置标识不一致,则判断第一数据分组位置标识与第二数据分组位置标识的差值绝对值是否满足预设误差;
[0021]若差值绝对值满足预设误差,则根据待处理数组的中值近似值所在的数据分组,确定中值近似值;
[0022]若差值绝对值不满足预设误差,则将预定义的近似中值查找事件的当前状态切换为第一状态,返回根据预定义的近似中值查找事件的当前状态,确定待处理数组的均值和标准差的步骤。
[0023]在其中一个实施例中,根据均值和标准差,构建累积频率分布表包括:
[0024]根据均值和标准差,确定多个数据划分区间;
[0025]根据多个数据划分区间,将待处理数组划分为多个数据分组;
[0026]统计各数据分组的累积频率;
[0027]基于各数据分组和各数据分组的累积频率,构建累积频率分布表。
[0028]在其中一个实施例中,统计各数据分组的累积频率包括:
[0029]统计分布在各数据分组内的数据个数,得到各数据分组的频数;
[0030]基于各数据分组的频数,确定各数据分组的频率;
[0031]对各数据分组的频率进行向上累积求和,得到各数据分组的累积频率。
[0032]第二方面,本申请还提供了一种数据集的中值近似值查找装置,该数据集包括多个数组,多个数组采用同一均值和标准差表征数据分布。所述装置包括:
[0033]数据获取模块,用于获取当前的待处理数组和预定义的近似中值查找事件的当前状态;
[0034]均值标准差确定模块,用于根据预定义的近似中值查找事件的当前状态,确定待处理数组的均值和标准差;
[0035]累积频率分布表构建模块,用于根据均值和标准差,构建累积频率分布表,累积频率分布表包括多个数据分组,数据分组由待处理数组划分得到;
[0036]中值近似值确定模块,用于基于累积频率分布表和预定义的近似中值查找事件的当前状态,查找出待处理数组的中值近似值所在的数据分组,确定待处理数组的中值近似值,并将均值、标准差、中值近似值以及中值近似值所在的数据分组的位置标识传递给下一数组,若预定义的近似中值查找事件的当前状态为第一状态,则将第一状态切换为第二状态,位置标识用于表征数据分组在完成数据划分后的数组中所处的位置;
[0037]循环处理模块,用于控制数据获取模块执行获取待处理数组和预定义的近似中值查找事件的当前状态的操作,直至查找出数据集中所有数组的中值近似值。
[0038]第三方面,本申请还本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据集的中值近似值查找方法,其特征在于,所述数据集包括多个数组,所述多个数组采用同一均值和标准差表征数据分布;所述数据集的中值近似值查找方法包括:获取当前的待处理数组和预定义的近似中值查找事件的当前状态;根据所述预定义的近似中值查找事件的当前状态,确定所述待处理数组的均值和标准差;根据所述均值和所述标准差,构建累积频率分布表,所述累积频率分布表包括多个数据分组,所述数据分组由所述待处理数组划分得到;基于所述累积频率分布表和所述预定义的近似中值查找事件的当前状态,查找出所述待处理数组的中值近似值所在的数据分组,确定所述待处理数组的中值近似值,并将所述均值、所述标准差、所述中值近似值以及所述中值近似值所在的数据分组的位置标识传递给下一数组,若所述预定义的近似中值查找事件的当前状态为第一状态,则将所述第一状态切换为第二状态,所述位置标识用于表征数据分组在完成数据划分后的数组中所处的位置;返回所述获取待处理数组和预定义的近似中值查找事件的当前状态的步骤,直至查找出所述数据集中所有数组的中值近似值。2.根据权利要求1所述的数据集的中值近似值查找方法,其特征在于,根据所述预定义的近似中值查找事件的当前状态,确定所述待处理数组的均值和标准差包括:当所述预定义的近似中值查找事件的当前状态为第一状态时,则计算所述待处理数组的均值和标准差;当所述预定义的近似中值查找事件的当前状态为第二状态时,则将接收到的上一数组所述待处理数组的均值和标准差确定为所述待处理数组的均值和标准差。3.根据权利要求1所述的数据集的中值近似值查找方法,其特征在于,所述基于所述累积频率分布表和所述预定义的近似中值查找事件的当前状态,查找出所述待处理数组的中值近似值所在的数据分组,确定所述待处理数组的中值近似值包括:当所述预定义的近似中值查找事件的当前状态为第一状态时,则根据所述累积频率分布表,查找出所述待处理数组的中值近似值所在的数据分组,确定所述待处理数组的中值近似值;当所述预定义的近似中值查找事件的当前状态为第二状态时,则根据所述累积频率分布表,查找出所述待处理数组的中值近似值所在的数据分组,获取第一数据分组位置标识,当所述第一数据分组位置标识与第二数据分组位置标识一致时,则将接收到的上一数组的中值近似值确定为所述待处理数组的中值近似值;其中,所述第一数据分组位置标识为待处理数组的中值近似值所在的数据分组的位置标识,所述第二数据分组位置标识为接收到的上一数组的中值近似值所在的数据分组的位置标识。4.根据权利要求3所述的数据集的中值近似值查找方法,其特征在于,所述获取第一数据分组位置标识之后,还包括:若所述第一数据分组位置标识与所述第二数据分组位置标识不一致,则判断所述第一数据分组位置标识与所述第二数据分组位置标识的差值绝对值是否...

【专利技术属性】
技术研发人员:李肯立李芬芳罗辉章阳王东唐卓刘楚波
申请(专利权)人:湖南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1