一种基于最近邻聚类的神经网络数据挖掘方法技术

技术编号：13837901 阅读：66 留言：0更新日期：2016-10-16 00:21

本发明专利技术公开了一种基于最近邻聚类的神经网络数据挖掘方法，该神经网络数据挖掘方法采用一种改进的最近邻聚类学习算法对神经网络进行训练，使神经网络在满足精度要求的前提下，减少隐层节点数，简化网络结构，加快神经网络的学习速度，达到进一步改善神经网络学习效率和精度的目的，在此基础上用神经网络进行数据挖掘，以进一步提高神经网络对大型实际电力系统数据库进行挖掘时的效率。本发明专利技术的目的在于保证电力系统的安全、稳定、优质、经济的运行，满足数字电力系统中的海量数据以及人们对数据信息的可靠性、一致性和共享性提出的更高的要求。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种应用于电力系统相关信息的数据挖掘方法，特别是涉及一种利用最近邻聚类算法训练神经网络的神经网络数据挖掘方法，本专利技术属电力系统数据分析领域。
技术介绍
随着电力工业的飞速发展和信息技术以及计算机技术在电力系统中的普及，数字化技术近年来得到广泛应用，出现了电力信息化--数字电力系统。在线实时监控系统、交易系统、地理信息管理系统、故障诊断、离线的各种分析计算和规划系统，以及电力企业的日常事务处理、通信和能量管理等系统在电力企业得到了广泛应用。但电力系统是一个动态非线性的大系统，这些系统在运行过程中不断产生和积累大量的数据，这些实时数据已经呈爆炸增长态势。此外，PsS/E，EMTP，PsAsP，BPA等电力系统仿真软件在电力系统分析计算中的广泛应用，也使系统产生了大量的仿真数据。基于传统数据库的数据管理系统，随着数据量的增加，统计查询性能大幅度下降，用户不能随意地利用这些大量的数据进行统计分析，而且数据利用率低下，海量的历史数据在默默地沉睡，数据中有价值的特征提取困难，导致利用这些数据对业务进行及时地预测和指导就比较困难。随着人们对数据信息的可靠性、一致性和共享性提出的更高要求，以及更好地保证电力系统的安全、稳定、优质、经济的运行，电力系统中日益迫切需要解决的问题就是如何对海量、时变及移动数据进行综合处理，以及对采集到的数据进行数据挖掘。这样就可以更加充分地利用运行数据，揭示历史数据背后蕴含的规则和原理，找到更加合理的解决问题的方法，为决策的制定和执行提供更加有力的科学依据。数据挖掘在电力系统中的主要应用有电力系统负荷预测和分类、电力系统的运...

【技术保护点】
一种基于最近邻聚类的神经网络数据挖掘方法，其特征在于：采用最近邻聚类学习算法对神经网络进行训练，减少神经网络的隐层节点数，简化网络结构，加快神经网络的学习速度，在此基础上用神经网络对大型实际电力系统数据库进行数据挖掘，具体步骤包括：步骤1：对实际电力系统数据库中的电力数据进行清洗和选择；步骤2：对经过步骤1处理后的电力数据预处理和转换；步骤3：对经过步骤2处理后的电力数据进行数据集管理；步骤4：针对步骤3产生的数据集，确定神经网络类型、算法并训练神经网络；步骤5：从训练好的神经网络中提取规则；步骤6：对提取的规则进行评估。

【技术特征摘要】
1.一种基于最近邻聚类的神经网络数据挖掘方法，其特征在于：采用最近邻聚类学习算法对神经网络进行训练，减少神经网络的隐层节点数，简化网络结构，加快神经网络的学习速度，在此基础上用神经网络对大型实际电力系统数据库进行数据挖掘，具体步骤包括：步骤1：对实际电力系统数据库中的电力数据进行清洗和选择；步骤2：对经过步骤1处理后的电力数据预处理和转换；步骤3：对经过步骤2处理后的电力数据进行数据集管理；步骤4：针对步骤3产生的数据集，确定神经网络类型、算法并训练神经网络；步骤5：从训练好的神经网络中提取规则；步骤6：对提取的规则进行评估。2.根据权利要求1所述的一种基于最近邻聚类的神经网络数据挖掘方法，其特征在于：所述步骤1、步骤2中，对电力系统中的数据，根据具体的目标和需要进行清洗和选择，剔除不需要的数据；然后对数值型数据采用归一化方法进行处理，将文本数据转换为数值数据进行处理。3.根据权利要求1所述的一种基于最近邻聚类的神经网络数据挖掘方法，其特征在于：所述步骤3中，将预处理以后的数据随机地划分成三个数据集：训练数据集、测试数据集和确认数据集，所述训练数据集用以训练神经网络，所述测试数据集用以测试网络的精度，所述确认数据集用以独立地测试网络，并对步骤6产生的提取规则进行评估。4.根据权利要求1所述的一种基于最近邻聚类的神经网络数据挖掘方法，其特征在于：所述步骤4中，所述神经网络类型采用三层前馈RBF神经网络；所述算法采用改进的最近邻聚类学习算法训练该神经网络，神经网络输入、输出节点的数目由电力系统具体的决策决定，神经网络的输出由模糊推理系统推出正则化输出，隐含层节点的数目由最近邻聚类算法决定。5.根据权利要求4所述的一种基于最近邻聚类的神经网络数据挖掘方法，其特征在于：通过对聚类半径r的调整，使聚类中心个数即RBF隐层节点数达到最佳，对RBF神经网络的参数和结构两个过程同时进行在线自适应调整，具体步骤包括：Step1：设置初始聚类半径为r，将归一化的数据xk读入，作为RBF神经网络的输入，并计算xk与现有其它数据的最小欧式距离，得到最小的距离dmin，并将位置记为p；Step2：若dmin>r，则聚类数加1为m＝m+1，m表示聚类数，当前样本送新的聚类中心ci，否则第p个聚类成员加1，并修正聚类相关变量；Step3：各类的输出矢量之和记为A(l)，用一个计数器B(l)表示用于统计属于各类的样本个数，其中l是类别数，计算神经网络隐层到输出层权矢量Wi＝A(i)/B(i)；其中，i表示第i个迭代，A(i)表示第i个迭代时的各类输出矢量之和，B(i)表示第i个迭代时各类样本个数之和，W(i)表示第i个输出层权矢量；Step4：根据正则化RBF神经网络的输出得到 y ^ ( x k ) = Σ i = 1 m W ( ...

【专利技术属性】
技术研发人员：刘育权，胡剑锋，莫文雄，潘玉春，陆国俊，唐晓莉，王勇，张高峰，
申请(专利权)人：广州供电局有限公司，南京南瑞继保电气有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人