一种基于聚类算法的用户用电行为监测方法技术

技术编号:16458069 阅读:33 留言:0更新日期:2017-10-25 22:41
一种基于聚类算法的用户用电行为监测方法,该方法克服了现有方法分析时间耗时长、可变更性差的缺点,从电度电费相关的因素出发,充分应用数理统计中的聚类分析法,对大量样本数据进行分析计算,大幅度提高了该方法的实际可操作性,具有很高的工程应用价值;本方法具有较高的适应性,可适用于不同地区、不同规模用电客户群的电度电费的划分,能够为差异化的电度电费管理及相关技术导则、标准的制定奠定基础。

A method for monitoring user's power consumption based on clustering algorithm

A clustering algorithm based on user behavior monitoring method, this method overcomes the defects of the existing analysis method of time long time, can change the shortcomings of the poor, starting from the power cost related factors, full clustering analysis method is applied in mathematical statistics, the data analysis and calculation, greatly improves the actual of the operation, has high engineering application value; this method has high adaptability, suitable for different regions and different scale with customers divide the electric power cost, can provide differentiated degree electricity fee management and relevant technical guidelines and standards laid the foundation.

【技术实现步骤摘要】
一种基于聚类算法的用户用电行为监测方法
本专利技术涉及电力监测
,尤其涉及基于聚类算法的用户用电行为监测方法。
技术介绍
随着我国经济的快速发展和人民生活水平的日益改善,居民用电量呈现增长态势,用电需求趋于多元化。随着社会对环境保护、节能减排和可持续性发展的要求日益提高,未来的电网必须能够提供更加安全、可靠、清洁、优质的电力供应,提供更加优质的服务。监测用户的用电行为对差异电价的实施、用电用电负荷、用电抢修、基建及技改大修等有着密不可分的关系。电量电费是监测用户用电行为的基本和核心模块,也是技术处理最复杂的模块。电量电费中按实际用电量计算的电费部分为电度电费。基于单一电力系统的用户电度电费数据,统计并挖掘电力客户的用电模式,是目前电力企业掌握客户构成,了解用电行为特征的基础,也是提供个性化、精细化用电服务,实现客户智能化、精益化管理的先决条件。但是,随着电力通信技术的发展,用电信息采集系统及其他相关业务系统每天产生的用电数据是高频海量的,这对用户行为特征分析技术提出了能够调整、高精度处理数量庞大且数据类型众多的用电数据,从中发掘高价值信息的要求。这符合典型大数据应用特征,同时也意味着使用传统计算结构和数据挖掘方式无法满足上述要求。现有技术中,对电力用户分类展开研究。如:以传统行业划分为基础,提出基于聚类的用户分类研究,其分类的结果与目录电价中按照行业划分的结果相似,但其没有考虑用户用电方式的差别;也有提出从当前市场价值、潜在市场价值、区域贡献价值等方面对用户进行分类研究,建议对不同类型用户制定不同的营销策略。然而这些方法缺乏用户行为的分类,不符合电力负荷精细化管理的能源战略。针对变电站负荷提出模糊C均值聚类方法,把变电站负荷分为工业、农业、市政等类别,结论认为该方法明显优于基于等价关系的聚类法。同一簇中的对象尽可能相似,而不同簇中的对象尽可能相异。聚类具有能够处理不同字段类型和发现任意簇形状的能力,具有处理异常数据,对数据顺序不敏感以及对领域知识的弱依赖性等特点。但是,随着互联网的发展和计算机技术的应用普及,对海量数据进行聚类分析的要求也越来越高。为了降低聚类算法的处理时间或数据存储空间,目前已有很多学者提出了解决办法,主要有顺序法、划分法、取样法、数据总结法、并行和分布式法等。常见的顺序聚类算法有SequentialK-means、竞争学习等,即无需将所有数据均加载到内存之后再进行聚类计算,而是将加载数据和计算同时进行,在有限计算能力和内存形式下,较好地解决了处理海量数据时面对的内存不足问题。划分法(如CURE算法)首先将数据分为不相交的子集,然后分别对子集进行聚类,最后将合并的聚类结果作为原始数据集的聚类结果。取样法(如CLARA聚类)认为,假设海量数据的部分取样能代表整体,则基于部分取样的聚类结果将被近似认为是全局的聚类结果。以BIRCH为代表的数据总结法通常是先对数据使用顺序法进行处理,得到总结信息后再对其完成聚类运算。以MapReduce分布式平台为代表的云计算,能同时使用多个处理器进行并行计算和分布式处理。然而现有技术的运算耗时较长,同时仅对单一系统进行了数据处理,缺乏数据的全面性。
技术实现思路
针对现有技术的不足,本专利技术的目的是提供一种基于聚类算法的电度电费标签化管理方法,该方法克服了现有方法分析时间耗时长、可变更性差的缺点,从电度电费相关的因素出发,充分应用数理统计中的聚类分析法,对大量样本数据进行分析计算,大幅度提高了该方法的实际可操作性,具有很高的工程应用价值;本方法具有较高的适应性,可适用于不同地区、不同规模用电客户群的电度电费的划分,能够为差异化的电度电费管理及相关技术导则、标准的制定奠定基础。本专利技术提出一种将云平台的并行计算和聚类算法k-means相结合的针对用户用电行为的监测方法,该方法包括以下七个步骤:首先、收集用电用户电度电费信息及其他相关数据;其次、电度电费信息及其他相关数据的统计描述,了解数据的基本状况;第三、电度电费数据及其他相关数据的清洗与转换,为数据建模提供准备;第四、电度电费的相关特征提取,形成指标类数据;第五、通过尝试聚类,确定聚类数目,完成对各个主要指标的数据的聚类分析,将不同的电度电费标记为相应的标签,建立整体的电度电费的标签体系;第六、整体的电度电费的标签体系利用聚类算法,将总体标签划分为几大重点类;第七、完成模型的部署与应用。本专利技术的有益效果解决了现有技术分析时间耗时长、可变更性差的缺点,从电度电费相关的因素出发,充分应用数理统计中的聚类分析法,对大量样本数据进行分析计算,大幅度提高了该方法的实际可操作性,具有很高的工程应用价值;本方法具有较高的适应性,可适用于不同地区、不同规模用电客户群的电度电费的划分,能够为差异化的电度电费管理及相关技术导则、标准的制定奠定基础,快速、有效地完成居民用户行为分析任务。附图说明图1用户用电行为监测流程图。具体实施方式下面对照附图1,通过对实施例的描述,本专利技术的具体实施方式作进一步详细的说明,以帮助本领域技术人员对本专利技术的专利技术构思、技术方案有更完整、准确和深入的理解。本专利技术的如图1所示,包括收集用电用户电度电费信息及其他相关数据、电度电费信息及其他相关数据的统计、电度电费数据及其他相关数据的清洗与转换、电度电费的相关特征提取、确定聚类数目,完成对各个主要指标的数据的聚类分析,将不同的电度电费标记为相应的标签,建立整体的电度电费的标签体系、整体的电度电费的标签体系利用聚类算法,将总体标签划分为几大重点类、完成模型的部署与应用七个步骤。通过识别不同客户群体的行为特征,实现对客户认知、风险管理、个性化营销和服务的科学规范管理,同时实现用户用电行为监测。数据展示结果直接与用户交互,是数据挖掘的最终产出物,数据挖掘的展示主要采用以下五种方式:(1)企业级报表。可以将数据挖掘的结果转化为领导关注的企业层面的战略报表,其中包含领导日常关注的战略性KPI指标数据。(2)OLAP分析。数据挖掘也可以输出为一个数据立方体,其数据可以用来做OLAP分析。立方体分析就是使用标准的多维分析功能,如分页、旋转、排序、筛选和向上下钻取来浏览报表。立方体分析适用于对指标变化的根本原因或潜在原因比较关注而对数据库技巧不是非常熟悉的人员。能做到快速的报表分析和操作、个性化和安全地共享立方体、自动创建和同步立方体、从汇总数据向详细交易数据任意钻取。(3)图表。根据数据挖掘的结果数据可以输出为各种形式的图表,如:反应数据绝对量的柱状图、反应数据变化趋势的曲线图、反应数据权重比例的饼状图等等。(4)数据透视表。以交叉表的形式展现结果数据。(5)文字说明。用文字简单直接的描述客户所最关心的内容。本文档来自技高网
...
一种基于聚类算法的用户用电行为监测方法

【技术保护点】
一种基于聚类算法的用户用电行为监测方法,其特征在于,该方法步骤包括七个步骤:首先、收集用电用户电度电费信息及其他相关数据;其次、电度电费信息及其他相关数据的统计描述,了解数据的基本状况;第三、电度电费数据及其他相关数据的清洗与转换,为数据建模提供准备;第四、电度电费的相关特征提取,形成指标类数据;第五、通过尝试聚类,确定聚类数目,完成对各个主要指标的数据的聚类分析,将不同的电度电费标记为相应的标签,建立整体的电度电费的标签体系;第六、整体的电度电费的标签体系利用聚类算法,将总体标签划分为重点类;第七、完成模型的部署与应用。

【技术特征摘要】
1.一种基于聚类算法的用户用电行为监测方法,其特征在于,该方法步骤包括七个步骤:首先、收集用电用户电度电费信息及其他相关数据;其次、电度电费信息及其他相关数据的统计描述,了解数据的基本状况;第三、电度电费数据及其他相关数据的清洗与转换,为数据建模提供准备;第四、电度电费的相关特征提取,形成指标类数据;第五、通过尝试聚类,确定聚类数目,完成对各个主要指标的数据的聚类分析,将不同的电度电费标记为相应的标签,建立整体的电度电费的标签体系;第六、整体的电度电费的标签体系利用聚类算法,将总体标签划分为重点类;第七、完成模型的部署与应用。2.如权利要求1所述一种基于聚类算法的用户用电行为监测方法,其特征在于,数据展示结果直接与用户交互,是数据挖掘的最终产出物,数据挖掘的展示采用企业级报表形式,将数据挖掘的结果转化为领导关注的企业层面的战略报表,其中包含领导日常关注的战略性KPI指标数据。3....

【专利技术属性】
技术研发人员:谭洪恩李钊雷振江申扬冉冉于海曹国强杨华飞赵希超
申请(专利权)人:国网辽宁省电力有限公司国网辽宁省电力有限公司电力科学研究院南京南瑞集团公司国家电网公司
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1