一种基于自动最优聚类算法的用户用电行为分析方法技术

技术编号:19965143 阅读:38 留言:0更新日期:2019-01-03 13:17
本发明专利技术公开了一种基于自动最优聚类算法的用户用电行为分析方法,通过将用户用电数据进行自动最优聚类,形成具有同类特征的用户集,对各类用户,分别进行负荷分解,构建各类用户用电行为时序,采用关联关系以及强关联规则提取方法,挖掘各类用户的用电行为特征,构建不同类用户的用电行为规律。

A User Electricity Behavior Analysis Method Based on Automatic Optimal Clustering Algorithms

The invention discloses an analysis method of user's electricity consumption behavior based on automatic optimal clustering algorithm. By automatically optimum clustering of user's electricity consumption data, a set of users with similar characteristics is formed. Load decomposition is carried out for various users, and the time sequence of user's electricity consumption behavior is constructed. The power consumption of various users is mined by using association relation and strong association rule extraction method. Behavior characteristics, build different types of users of electricity behavior law.

【技术实现步骤摘要】
一种基于自动最优聚类算法的用户用电行为分析方法
本专利技术属于电力系统大数据处理
,更为具体地讲,涉及一种基于自动最优聚类算法的用户用电行为分析方法。
技术介绍
数据挖掘是当今的热门学科之一,利用数据挖掘技术可以从海量数据中提取出有效信息,为管理者统筹、决策提供参考。聚类分析是数据挖掘领域内的重要分支,利用聚类技术,对大量智能电表记录的用电数据进行分类,找出具有相似特征的用户,划分用户类型。对处于不同类型的用户,分别构建用户用电模型,进行针对性的行为分析,发现用户用电的规律,将这些规律与电力营销策略等相结合,从而发现目前电力销售活动中可能存在的问题,并进一步修正,同时可以指导不同类型的用户合理用电,能有效降低电网调度成本,支撑电网安全稳定运行。由于用户用电具有随机性,各用电设备电气特征差异很大,采用传统的聚类分析的效果不佳。而且,不同时期用户的用电行为特征差异也很大,因此需要自动聚类方法,适应用户用电行为分析动态变化。文献“张素香,刘建明,赵丙镇,等.基于云计算的居民用电行为分析模型研究.电网技术,2013,37(6):1542-1546.”提出基于云计算的居民用电行为分析方法。采用k-means聚类算法对居民用电数据分析,将居民用户分为多类,构建用户用电规律。该方法需要人工设定用户类别数量和对应类别的初始点,容易形成局部最优解,得到的用户用电规律有限,仅能得到某类用户在某时段的用电趋势。文献“王星华,陈卓优,彭显刚.一种基于双层聚类分析的负荷形态组合识别方法_王星华.电网技术,2016,(5):1495-1501.”提出了时间序列数据双层聚类方法,分别用余弦相似度和欧氏距离作为聚类的距离指标,并且给出了简洁快速的初始聚类中心的选取规则,最终得到了稳定性和精确度良好的聚类算法。文献“张欣,高卫国,苏运.基于函数型数据分析和k-means算法的电力用户分类.电网技术,2015,(11):3153-3162.”利用核回归将离散的电量数据还原成连续的曲线,再进行聚类分析,解决了电量数据长短不一致,欧氏距离的计算问题。文献提出了Pearson相关系数聚类算法,将Pearson相关系数作为样本相似性的指标,该算法侧重于时间序列曲线轮廓的聚类,充分反应了时间序列曲线的轮廓的相似性。文献“王星华,许炫壕,周亚武.一种基于Pearson相关系数的电力用户负荷曲线聚类算法_王星华.黑龙江电力,2017,(5):397-401,415.”针对时间序列数据,总结了聚类分析中,对聚类效果有重大影响的相似性度量指标。以上聚类方法需要人工确定参数,因此,为了进一步分析海量用电数据中隐藏的价值信息,需要提出新的自动聚类方法来分析用户用电数据。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种基于自动最优聚类算法的用户用电行为分析方法,通过自动最优聚类方式,完成对用户用电数据的聚类,从而挖掘出用户用电行。为实现上述专利技术目的,本专利技术一种基于自动最优聚类算法的用户用电行为分析方法,其特征在于,包括以下步骤:(1)、用户用电负荷数据预处理采集N组用户用电负荷数据,判断各组用户用电数据是否完整,再对不完整的用户用电负荷数据进行处理,其中,对间断缺失的用户用电负荷数据,采用上下两个点数据求均值的方式进行补差;对连续缺的用户用电负荷数据,采用模糊预测手段来补差,以保证用户用电负荷数据的完整性;(2)、亲和度传播聚类(2.1)、构建相似度矩阵S,S中的元素表示任意两组用户用电负荷数据xi、xj间的相似度,通过计算两组用户用电负荷数据间的欧氏距离得到,即:其中,S的大小为N×N,i,j∈N;(2.2)、选择相似度的中值或最小值作为偏向参数P,再用偏向参数P替代相似度矩阵S的主对角元素;(2.3)、设置最大迭代次数T;计算第t次迭代时的吸引度矩阵Rt和归属度矩阵At,t=1,2,…,T;其中,Rt中的元素rt(i,j)为:rt(i,j)=st(i,j)-max(at-1(i,j′)+st-1(i,j′)),j≠j'其中,At中的元素at(i,j)为:(2.4)、设置初始阻尼因子γ0,γ0∈(0,1);再利用初始阻尼因子γ0更新吸引度矩阵Rt和归属度矩阵At;更新后的吸引度矩阵Rt为:Rt=Rt·(1-γ0)+Rt-1·γ0;更新后的归属度矩阵At为:At=At·(1-γ0)+At-1·γ0(2.5)、利用亲和度传播聚类,输出聚类数量和聚类中心点判断当前迭代次数是否达到设置的最大次数或迭代次数内聚类的结果没有改变,则迭代停止,将当前迭代完成后的吸引度矩阵Rt和归属度矩阵At作为最终的迭代结果;然后在迭代完成后的吸引度矩阵Rt和归属度矩阵At中,找到元素rt(i,k)和at(i,k),k∈N,选择最大化rt(i,k)+at(i,k)的k作为聚类中心点,输出聚类数量;如果找不到,则自动初始阻尼因子γ0,再返回步骤(2.4);(3)、将步骤(2)得到的聚类中心和聚类数量作为K均值算法的初始聚类中心和K值,进行第二次聚类,输出分类簇、类别数量和中心点,从而得到用户用电信息中具有相似特征的用户及用户类型;(4)、挖掘各类用户的用电规律。(4.1)、根据每一类用户用电曲线在一段时间内的变化情况,判断该类用户中各用电设备的运行状态是否变化,通过负荷曲线中的突变信息,将用户负荷分解为各用设备;(4.2)、分解后的各用电设备,根据时间排序,从而构建该类用户用电行为序列,然后使用时序关联关系分析算法分析用户用电行为序列,找到该类用户用电行为特征;(4.3)、结合该类用户的总体特征,挖掘同类用户用电行为强关联规则,构建不同类用户的用电行为规律。本专利技术的专利技术目的是这样实现的:本专利技术一种基于自动最优聚类算法的用户用电行为分析方法,通过将用户用电数据进行自动最优聚类,形成具有同类特征的用户集,对各类用户,分别进行负荷分解,构建各类用户用电行为时序,采用关联关系以及强关联规则提取方法,挖掘各类用户的用电行为特征,构建不同类用户的用电行为规律。同时,本专利技术一种基于自动最优聚类算法的用户用电行为分析方法还具有以下有益效果:(1)、提出了计及亲和度传播聚类和K均值算法的自动最优聚类方法,保障用户用电行为随机波动情况下,能自动全局寻优,具有优良的用户分类效果,同时有效减少了算法程序的计算量和运行时间;(2)自动最优聚类方法无需确定聚类中心点和聚类数量,通过设置系统阻尼系数,即可获取全局最优聚类划分;(3)通过将负荷分解加入到传统的关联算法流程中,对分类后的用户进行用电行为规律分析,提供了有价值的不同类型用户用电规律。附图说明图1是本专利技术一种基于自动最优聚类算法的用户用电行为分析方法流程图;图2是利用本专利技术所述方法对用户用电行为的聚类结果图。具体实施方式下面结合附图对本专利技术的具体实施方式进行描述,以便本领域的技术人员更好地理解本专利技术。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本专利技术的主要内容时,这些描述在这里将被忽略。实施例图1是本专利技术一种基于自动最优聚类算法的用户用电行为分析方法的流程图。在本实施例中,如图1所示,本专利技术一种基于自动最优聚类算法的用户用电行为分析方法,包括以下步骤:S1、用户用电负荷数据预处理本实施以某地区智能电表计量1本文档来自技高网
...

【技术保护点】
1.一种基于自动最优聚类算法的用户用电行为分析方法,其特征在于,包括以下步骤:(1)、用户用电负荷数据预处理采集N组用户用电负荷数据,判断各组用户用电数据是否完整,再对不完整的用户用电负荷数据进行处理,其中,对间断缺失的用户用电负荷数据,采用上下两个点数据求均值的方式进行补差;对连续缺的用户用电负荷数据,采用模糊预测手段来补差,以保证用户用电负荷数据的完整性;(2)、亲和度传播聚类(2.1)、构建相似度矩阵S,S中的元素表示两组用户用电负荷数据间的相似度,通过计算两组用户用电负荷数据间的欧氏距离得到,即:

【技术特征摘要】
1.一种基于自动最优聚类算法的用户用电行为分析方法,其特征在于,包括以下步骤:(1)、用户用电负荷数据预处理采集N组用户用电负荷数据,判断各组用户用电数据是否完整,再对不完整的用户用电负荷数据进行处理,其中,对间断缺失的用户用电负荷数据,采用上下两个点数据求均值的方式进行补差;对连续缺的用户用电负荷数据,采用模糊预测手段来补差,以保证用户用电负荷数据的完整性;(2)、亲和度传播聚类(2.1)、构建相似度矩阵S,S中的元素表示两组用户用电负荷数据间的相似度,通过计算两组用户用电负荷数据间的欧氏距离得到,即:(2.2)、选择相似度的中值或最小值作为偏向参数P,再用偏向参数P替代相似度矩阵S的主对角元素;(2.3)、设置最大迭代次数T;计算第t次迭代时的吸引度矩阵Rt和归属度矩阵At,t=1,2,…,T;其中,Rt中的元素rt(i,j)为:rt(i,j)=st(i,j)-max(at-1(i,j′)+st-1(i,j′)),j≠j'其中,At中的元素at(i,j)为:(2.4)、设置初始阻尼因子γ0,γ0∈(0,1);再利用初始阻尼因子γ0更新吸引度矩阵Rt和归属度矩阵At;更新后的吸引度矩阵Rt为:Rt=Rt·(1-γ0)+Rt-1·γ0;更新后的归属度矩阵At为:A...

【专利技术属性】
技术研发人员:吴漾朱州王玮罗念华王鹏宇
申请(专利权)人:贵州电网有限责任公司信息中心
类型:发明
国别省市:贵州,52

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1