基于canopy、k-means算法的数据挖掘方法技术

技术编号:32659513 阅读:38 留言:0更新日期:2022-03-17 11:09
本发明专利技术提出的是基于canopy、k

【技术实现步骤摘要】
基于canopy、k

means算法的数据挖掘方法


[0001]本专利技术涉及电力领域的电网数据,特别是涉及基于canopy、k

means算法的数据挖掘方法。

技术介绍

[0002]电网在为人们的生活提供充足电力的同时,也存在着大量的电力数据信息,这些电力数据信息存在着隐藏价值,而在电力大数据中采用数据挖掘方法,可以快速地实现信息的获取转换。由于电力系统的大数据高频且分散,因此需要针对电力大数据采用智能化方法实现其快速准确的信息挖掘进而优化电网的管理。
[0003]数据挖掘是数据库知识发现中的一个步骤。数据挖掘,一般是指从大量的数据中自动搜索隐藏于其中的特殊关系型的信息的过程。数据挖掘在技术上的定义是指从大量的、不完全的、有噪声的、模糊的和随机的数据中,提取隐含在其中的、事先不知道的,但又有潜在有用信息和知识的过程。云计算是通过在分布式存储设备或虚拟机,按需分配资源,实现快速计算功能。

技术实现思路

[0004]为了解决现有电网中存在着海量电力数据,其中的数据隐藏价值有待深入挖掘本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于canopy、k

means算法的数据挖掘方法,其特征是:包括数据预测、数据分类和算法实现,具体的实现包括如下过程:步骤一、针对海量的电力数据进行数据预测,以得到数据的预期期望、量化范围以及聚散程度;步骤二、基于数据预测得到的相关数据指标,分析三类算法的优缺点,对数据进行分类以采用不同的数据挖掘算法;步骤三、将分类好的数据经过各算法,即canopy算法、k

means算法以及二者结合优化的canopy

k

means算法进行数据挖掘的实现。2.根据权利要求1所述的基于canopy、k

means算法的数据挖掘方法,其特征是:所述数据预测,算法的开始进行P组数据输入,根据对应条件规则将P组数据转化成M个条件云以及一个结论云;求取条件云的熵以及超熵从而生成P组随机值,进行条件云的隶属度求取以及得到P组隶属度的样本均值,上述步骤重复N次得到每组N个样本均值;将N个样本均值的最大值以及对应的结论云记录下来,生成一个结论云滴并且该结论云滴的隶属度应大于设定值,选取对应的新条件数据,重复上述步骤至选取Q个新条件数据;最后经过反向云发生器生成所需结论云,得到数据的预期期望、量化范围以及聚散程度;其中,P为待预测数据输入的组数;M为转化为条件云的个数;N为每组样本均值的个数;Q为新条件数据的个数。3.根据权利要求1所述的基于canopy、k

means算法的数据挖掘方法,其特征是:所述数据分类,针对数据预测结果,分析canopy算法、k

means算法以及二者结合优化的canopy

k

means算法的优缺点,对数据进行分类以更好得进行相应数据挖掘算法的实现;canopy算法的抗干扰能力强,同时其算法实现过程更容易理解,算法也更具有科学性同时由于其算法的固有属性导致其相似计算的数量也较少;但是算法中距离设定值的确定存在问题;对于k

means算法,通过较少的已知数据样本,就可以实现样本的分类;其次,该算法固有的属性可以很好地解决因样本数量少而产生的类别聚集不准确的问题;第三...

【专利技术属性】
技术研发人员:王南胡博李伟王丽霞王大维王磊周桂平陈浩刘旸白钦予郎业兴左越钟元辰曾辉路志桐张博栗鹏辉廉洪波
申请(专利权)人:国网辽宁省电力有限公司葫芦岛供电公司国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1