大量个体的数据趋势分析方法、电子设备和计算机存储介质技术

技术编号:19009811 阅读:25 留言:0更新日期:2018-09-22 09:36
本发明专利技术涉及一种大量个体的数据趋势分析方法、电子设备和计算机存储介质。该方法获取每个个体的多个有序数据;根据每个个体的多个有序数据,确定每个个体的斜率和确定系数;对每个个体的斜率和确定系数进行二维聚类;根据聚类结果分析每个个体的趋势。本发明专利技术的方法先根据每个个体的多个有序数据,确定每个个体的斜率和确定系数,再对每个个体的斜率和确定系数进行二维聚类,最后根据聚类结果分析每个个体的趋势,使得针对大量个体的数据趋势分析成为可能,有助于辅助政府,企业作出最佳决策。

A large number of individual data trend analysis methods, electronic devices and computer storage media.

The invention relates to a data trend analysis method for a large number of individuals, an electronic device and a computer storage medium. The method obtains the ordered data of each individual, determines the slope and determination coefficient of each individual according to the ordered data of each individual, carries out two-dimensional clustering on the slope and determination coefficient of each individual, and analyzes the trend of each individual according to the clustering results. The method of the invention first determines the slope and the determination coefficient of each individual according to the ordered data of each individual, then carries out two-dimensional clustering on the slope and the determination coefficient of each individual, and finally analyzes the trend of each individual according to the clustering result, making it possible to analyze the data trend of a large number of individuals, which is helpful to supplement. Help the government and enterprises make the best decision.

【技术实现步骤摘要】
大量个体的数据趋势分析方法、电子设备和计算机存储介质
本专利技术涉及数据处理领域,尤其涉及一种大量个体的数据趋势分析方法、电子设备和计算机存储介质。
技术介绍
随着数据大爆炸时代的到来,数据量极具增多,使得对大量个体的动态变化的数据进行趋势分析的需求急剧增加。例如,根据商场的顾客一年内的购买行为对不同购买行为的顾客进行分类,依据各类别的顾客采取不同的营销策略;需要对某个区域中所有企业3年内员工人数或者发放薪资总额变化情况进行分析,以获知哪些企业是处于发展壮大期,哪些企业是处于下滑期等,依据此政府对不同的企业采取不同的政策来辅助企业更好的生产经营或者预防企业发生不良事件等。因此,急需一种针对大量个体的数据趋势分析方法。
技术实现思路
(一)要解决的技术问题本专利技术提供一种大量个体的数据趋势分析方法、电子设备和计算机存储介质,该方法先根据每个个体的多个有序数据,确定每个个体的斜率和确定系数,再对每个个体的斜率和确定系数进行二维聚类,最后根据聚类结果分析每个个体的趋势,使得针对大量个体的数据趋势分析成为可能,有助于辅助政府,企业作出最佳决策。(二)技术方案为了达到上述目的,本专利技术采用的主要技术方案包括:一种大量个体的数据趋势分析方法,所述方法,包括:S101,获取每个个体的多个有序数据;S102,根据每个个体的多个有序数据,确定每个个体的斜率和确定系数;S103,对每个个体的斜率和确定系数进行二维聚类;S104,根据聚类结果分析每个个体的趋势。可选地,所述S101之后,S102之前,还包括:将每个个体的多个有序数据案子相同的方式进行排序。可选地,所述S102具体包括:对每个个体排序后的有序数据进行线性拟合,得到每个个体的斜率和确定系数。可选地,所述S103具体包括:S103-1,对每个个体的斜率进行排序,选择位于排序中间的第一预设数量个个体;S103-2,将选择的个体的斜率进行归一化操作;S103-3,对选择的个体的归一化后的斜率和确定系数进行二维聚类。可选地,所述S103-3具体包括:S103-3-1,随机选取第二预设数量个初始中心点;S103-3-2,遍历所有选择的个体,根据每个选择的个体的归一化后的斜率和确定系数,将每个选择的个体划分到最近的初始中心点所处的类别中;S103-3-3,计算划分后的各类的平均值,将所述平均值作为各类的新中心点;S103-3-4,若存在任一类的新中心点与初始中心点的偏差大于预设阈值,则将各类的新中心点作为初始中心点,重复执行S103-3-2和S103-3-3,直至各类新中心点与初始中心点的偏差均不大于预设阈值。可选地,所述S103-3-4之后,还包括:S103-3-5,计算每个类别的第一标准差;S103-3-6,将所有未选择的个体的斜率进行归一化操作;S103-3-7,遍历所有未选择的个体,根据每个未选择的个体的归一化后的斜率和确定系数,计算每个未选择的个体到各类别的新中心点的距离以及每个未选择的个体划分到各类别后,各类别的第二标准差;S103-3-8,针对每个未选择的个体,计算各类别的第二标准差-第一标准差的值Δσ;S103-3-9,对于任一未选择的个体,若存在一个最佳类别,则将所述任一未选择的个体划分到所述最佳类别中,所述最佳类别为:所述任一未选择的个体到该最佳类别的新中心点的距离最近,并且,所述任一未选择的个体划分到该最佳类别后的Δσ最小;S103-3-10,对于任一未选择的个体,若不存在最佳类别,则按所述任一未选择的个体到该各类别的新中心点的距离从近到远依次选择一个类别,若所述任一未选择的个体划分到选择的类别后的Δσ<所述任一未选择的个体划分到各类别后的Δσ均值,则将所述任一未选择的个体划分到选择的类别中。可选地,所述第二预设数量为大于5的整数;所述第一预设数量为S101中获取的个体数量*0.9的下取整。可选地,所述S104具体包括:将各类的趋势作为各类中每个个体的趋势。为了达到上述目的,本专利技术采用的主要技术方案还包括:一种计算机存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述方法任意一项的步骤。可选地,所述计算机存储介质位于变电站端,或者,所述计算机存储介质位于调度端。(三)有益效果本专利技术的有益效果是:先根据每个个体的多个有序数据,确定每个个体的斜率和确定系数,再对每个个体的斜率和确定系数进行二维聚类,最后根据聚类结果分析每个个体的趋势,使得针对大量个体的数据趋势分析成为可能,有助于辅助政府,企业作出最佳决策。附图说明图1为本专利技术一个实施例提供的一种大量个体的数据趋势分析方法方法流程图;图2为本专利技术一个实施例提供的一种电子设备的结构示意图。具体实施方式为了更好的解释本专利技术,以便于理解,下面结合附图,通过具体实施方式,对本专利技术作详细描述。随着数据大爆炸时代的到来,数据量极具增多,使得对大量个体的动态变化的数据进行趋势分析的需求急剧增加。因此,急需一种针对大量个体的数据趋势分析方法。基于此,本专利技术提供一种大量个体的数据趋势分析方法、电子设备和计算机存储介质,该方法先根据每个个体的多个有序数据,确定每个个体的斜率和确定系数,再对每个个体的斜率和确定系数进行二维聚类,最后根据聚类结果分析每个个体的趋势,使得针对大量个体的数据趋势分析成为可能,有助于辅助政府,企业作出最佳决策。参见图1,本实施例提供的大量个体的数据趋势分析方法实现流程如下:S101,获取每个个体的多个有序数据。在获取到每个个体的多个有序数据之后,还会将每个个体的多个有序数据案子相同的方式进行排序。S102,根据每个个体的多个有序数据,确定每个个体的斜率和确定系数。具体的,对每个个体排序后的有序数据进行线性拟合,得到每个个体的斜率和确定系数。S103,对每个个体的斜率和确定系数进行二维聚类。本步骤可以通过如下方案实现:S103-1,对每个个体的斜率进行排序,选择位于排序中间的第一预设数量个个体。可选的,第一预设数量为S101中获取的个体数量*0.9的下取整。由于斜率较易出现极端值,需要对极端值进行处理,因此,先对每个个体的斜率进行排序,选择位于排序中间的第一预设数量个个体,如取90%数据聚集区间的数据为分析对象,进入下一步操作,极端的数据在得到分类结果后与相应的分类结果进行合并。例如,S101中获取的个体数量为6,则第一数量为此时,选取位于排序中间的5个个体。S103-2,将选择的个体的斜率进行归一化操作。归一化操作之后,选择的个体的斜率全部化为0-1之间。S103-3,对选择的个体的归一化后的斜率和确定系数进行二维聚类。本步骤的实现方式,包括但不限于:使用K-means方法对选择的个体的归一化后的斜率和确定系数进行二维聚类。具体的,S103-3-0,预先设定第二预设数量k。k为需要聚类的类别数量。由于动态数据变化趋势较为复杂,k建议取值在5以上,具体数量可根据具体分析问题的需要决定。S103-3-1,随机选取k个初始中心点。S103-3-2,遍历所有选择的个体,根据每个选择的个体的归一化后的斜率和确定系数,将每个选择的个体划分到最近的初始中心点所处的类别中。S103-3-3,计算划分后的各类的平均值,将平均值作为各类的新中心点。S103-3-4,若存在任一类的新中心点与初始中心点的偏差大本文档来自技高网...
大量个体的数据趋势分析方法、电子设备和计算机存储介质

【技术保护点】
1.一种大量个体的数据趋势分析方法,其特征在于,所述方法,包括:S101,获取每个个体的多个有序数据;S102,根据每个个体的多个有序数据,确定每个个体的斜率和确定系数;S103,对每个个体的斜率和确定系数进行二维聚类;S104,根据聚类结果分析每个个体的趋势。

【技术特征摘要】
1.一种大量个体的数据趋势分析方法,其特征在于,所述方法,包括:S101,获取每个个体的多个有序数据;S102,根据每个个体的多个有序数据,确定每个个体的斜率和确定系数;S103,对每个个体的斜率和确定系数进行二维聚类;S104,根据聚类结果分析每个个体的趋势。2.根据权利要求1所述的方法,其特征在于,所述S101之后,S102之前,还包括:将每个个体的多个有序数据案子相同的方式进行排序。3.根据权利要求2所述的方法,其特征在于,所述S102具体包括:对每个个体排序后的有序数据进行线性拟合,得到每个个体的斜率和确定系数。4.根据权利要求3所述的方法,其特征在于,所述S103具体包括:S103-1,对每个个体的斜率进行排序,选择位于排序中间的第一预设数量个个体;S103-2,将选择的个体的斜率进行归一化操作;S103-3,对选择的个体的归一化后的斜率和确定系数进行二维聚类。5.根据权利要求4所述的方法,其特征在于,所述S103-3具体包括:S103-3-1,随机选取第二预设数量个初始中心点;S103-3-2,遍历所有选择的个体,根据每个选择的个体的归一化后的斜率和确定系数,将每个选择的个体划分到最近的初始中心点所处的类别中;S103-3-3,计算划分后的各类的平均值,将所述平均值作为各类的新中心点;S103-3-4,若存在任一类的新中心点与初始中心点的偏差大于预设阈值,则将各类的新中心点作为初始中心点,重复执行S103-3-2和S103-3-3,直至各类新中心点与初始中心点的偏差均不大于预设阈值。6.根据权利要求5所述的方法,其特征在于,所述S103-3-4之后,还包括:S...

【专利技术属性】
技术研发人员:叶梦晴杨帆刘丹
申请(专利权)人:广东金赋科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1