关键用电行业识别方法和系统技术方案

技术编号:15331058 阅读:63 留言:0更新日期:2017-05-16 14:23
本发明专利技术涉及一种关键用电行业识别方法及其系统,通过获取预设时间段内待测区域中的各个行业的用电量统计数据,根据各个行业的用电量统计数据,运用聚类分析对各个行业进行用电分类,得到各个行业所属的用电行业类别;然后根据所述用电量统计数据和用电行业类别计算出各个用电行业类别的用电量占比,再根据所述用电量统计数据和所述用电行业类别计算出各个用电行业类别的用电量波动对总用电量波动的影响值大小。最后根据各个用电行业类别的所述用电量占比和所述影响值大小,判断所述用电行业类别所包含的行业是否关键用电行业,从而实现准确的关键用电行业识别。

Key power industry identification methods and systems

The present invention relates to electric power industry identification method and system of a key, through access to electricity statistics a preset period of time measured in various industries in the region, according to statistical data of all the electricity industry, the cluster analysis was used for classification of the various sectors of various industries, to the electricity sector; then according to the statistical data of electricity and electricity industry categories to calculate the various electricity industry categories of electricity consumption accounted for, and then according to the various electricity industry categories of electricity consumption fluctuations on the total effect of fluctuation of electricity value calculation of electric power industry categories and the statistical data. Finally, according to the various sectors of the electricity consumption and the proportion of the value of influence size, whether the electricity industry is the key industry categories included in the electricity industry, so as to realize the accurate identification key of electricity industry.

【技术实现步骤摘要】
关键用电行业识别方法和系统
本专利技术涉及电行业分类的
,特别是涉及一种关键用电行业识别方法和系统。
技术介绍
对于电力部门而言,为了实现用电用户的精细化管理,提供优质的用电服务,挖掘与分析电力用户的用电模式有利于掌控用电群体构成及其用电特性,有利于识别影响用电量的关键因素,有利于对不同行业的用电量进行预测,并可以作为电力调度的依据。然而,如何对不同行业用户的用电量影响做准确的识别,一直是电力行业的技术人员难以解决的问题,尤其识别的准确度较差,是电力行业的一个技术瓶颈。
技术实现思路
基于此,有必要针对不同行业用户的用电量影响不能准确判断的技术问题,提供一种关键用电行业识别方法和系统,能够准确地识别不同行业用户的用电量影响力大小,为电力调度提供有效的依据。一种关键用电行业识别方法,包括如下步骤:获取预设时间段内待测区域中的各个行业的用电量统计数据;根据各个行业的用电量统计数据,运用聚类分析对各个行业进行用电分类,得到各个行业所属的用电行业类别;根据所述用电量统计数据和用电行业类别计算出各个用电行业类别的用电量占比;根据所述用电量统计数据和所述用电行业类别计算出各个用电行业类别的用电量波动对总用电量波动的影响值;根据各个用电行业类别的所述用电量占比和所述影响值大小,判断所述用电行业类别所包含的行业是否关键用电行业。一种关键用电行业识别系统,包括:数据获取模块,用于获取预设时间段内待测区域中的各个行业的用电量统计数据;聚类模块,用于根据各个行业的用电量统计数据,运用聚类分析对各个行业进行用电分类,得到各个行业所属的用电行业类别;用电占比计算模块,用于根据所述用电量统计数据和用电行业类别计算出各个用电行业类别的用电量占比;影响值计算模块,用于根据所述用电量统计数据和所述用电行业类别计算出各个用电行业类别的用电量波动对总用电量波动的影响值;识别模块,用于根据各个用电行业类别的所述用电量占比和所述影响值大小,判断所述用电行业类别所包含的行业是否关键用电行业。上述关键用电行业识别方法和系统通过获取预设时间段内待测区域中的各个行业的用电量统计数据,根据各个行业的用电量统计数据,运用聚类分析对各个行业进行用电分类,得到各个行业所属的用电行业类别;然后根据所述用电量统计数据和用电行业类别计算出各个用电行业类别的用电量占比,再根据所述用电量统计数据和所述用电行业类别计算出各个用电行业类别的用电量波动对总用电量波动的影响值大小。最后根据各个用电行业类别的所述用电量占比和所述影响值大小,判断所述用电行业类别所包含的行业是否关键用电行业,从而实现准确的关键用电行业识别。附图说明图1为一个实施例的关键用电行业识别方法的流程图;图2为一个实施例的关键用电行业识别系统的结构示意图。具体实施方式下面结合附图对本专利技术的关键用电行业识别方法和系统的具体实施方式作详细描述。参考图1,图1所示为一个实施例的关键用电行业识别方法流程图,包括如下步骤:S101,获取待测区域中在设定时间段内各个行业的用电量统计数据;上述步骤S101中,上述用电行业大致包括三个层次:第一层次可以包括第一产业,第二产业,第三产业,城乡居民生活用电量合计等;第二层次可以包括工业,商业住宿和餐饮业,公共事业及管理组织,金融、房地产、商务及居民服务业,建筑业,信息传输、计算机服务和软件业,交通运输、仓储和邮政业,农、林、牧、渔业等;第三层次可以包括交通运输电气电子设备制造业,橡胶和塑料制品业,金属制品业,服装鞋帽皮草羽绒及其制品业,批发和零售业,木材加工及制品和家具制造业等。上述用电行业还可以包括除上述以外的其他对象。基于行业全覆盖与避免重复的考虑,可以对用电行业作适当的合并整理。上述设定时间段的单位可以包括月,季度,年等。上述用电量统计数据可以包括总用电量,平均用电量,中位数用电量,标准差等。S102,根据所述用电量统计数据筛选出待测区域中的关键用电行业根据各个行业的用电量统计数据,运用聚类分析对各个行业进行用电分类,得到各个行业所属的用电行业类别;聚类分析作为一种被广泛应用的数据挖掘算法,能够以较高的处理效率获得数据在全局范围内的分布特征。聚类是将众多对象分为多个类或簇的过程,同一类中的对象尽可能相似,而不同类中的对象尽可能相异。以聚类算法所采用的基本思想为依据可将它们分为四类,即层次聚类算法、分割聚类算法、基于约束的聚类算法、机器学习中的聚类算法。本专利技术每个用电行业类别均用该类中所有数据的平均值(或加权平均)来表示,这个平均值即被称作聚类中心,该方法对于数值属性的数据能很好地体现聚类在几何和统计学上的意义。具有收敛速度快,算法简单等特点,并可以轻松部署到基于Hadoop的分布式大数据云计算平台,适用于分析海量的用电大数据。适合对各企业的用电量变化情况进行分类,找出典型的用电模式,并依此对行业进行分类。在一个实施例中,运用聚类分析对各个行业进行用电分类,得到各个行业所属的用电行业类别的步骤包括:随机设定数据集中的K(K属于自然数)个数据点作为初始聚类中心;其中,所述数据集包含若干个行业,每个行业的用电量统计数据序列有若干个数据点,每个数据点为预设时间段内的用电量统计数据;计算所述数据集中的每个数据点与各个聚类中心的欧几里得距离;将每个数据点归入与其距离最近的类别;计算每个分类中心各个数据点的均值作为新的聚类中心;判断数据点的类别划分是否发生变化,如果是,则输出聚类结果;否则,返回计算数据集中的每个数据点与各个聚类中心的欧几里得距离的步骤。通过合理设定所述数据集,计算每个数据点与各个聚类中心的欧几里得距离将每个数据点归入相应的类别,并计算每个分类中心各个数据点的均值作为新的聚类中心,判断聚类结果是否准确,可以具有较高的分类准确性。在一个实施例中,计算数据集中的每个数据点与各个聚类中心的欧几里得距离的步骤包括:计算各类别中的数据点到其聚类中心uk的距离平方和:其中,所述数据集包含n个行业,每个行业的用电量统计数据序列有d个数据点,每个数据点为预设时间段内的用电量统计数据,所述数据集表示为X={x1,x2,L,xi,Lxn},其中将行业划分为C={c1,c2,L,ck,L,cK},ck为代表一个类别,每个类别都有一个中心uk,该中心为类别内各数据点的平均值。xi∈Rd。通过合理设定所述数据集,按照上述方式计算的欧几里得距离准确度较高。在另一个实施例中,还可以选择聚类分析中广泛应用的组间距离平方和BSS(Between-ClusterSumofSquares)与总体距离平方和TSS(TotalSumofSquares)的比值BSS/TSS作为聚类结果的评价指标。BSS/TSS的值处于0%到100%之间,该值越接近100%,表示用电行业类别内的相似性越高,同时类别间的区分度更高,也就说明聚类的效果越好。因此,计算数据集中的每个数据点与各个聚类中心的欧几里得距离的步骤包括:计算组间距离平方和与总体距离平方和的比值BSS/TSS;其中,所述数据集包含n个行业,每个行业的用电量统计数据序列有d个数据点,每个数据点为预设时间段内的用电量统计数据,所述数据集表示为X={x1,x2,L,xi,Lxn},其中,将行业划分为C={c1,c2,L,ck,L,cK},ck为代表一个类别,本文档来自技高网...
关键用电行业识别方法和系统

【技术保护点】
一种关键用电行业识别方法,其特征在于,包括如下步骤:获取预设时间段内待测区域中的各个行业的用电量统计数据;根据各个行业的用电量统计数据,运用聚类分析对各个行业进行用电分类,得到各个行业所属的用电行业类别;根据所述用电量统计数据和用电行业类别计算出各个用电行业类别的用电量占比;根据所述用电量统计数据和所述用电行业类别计算出各个用电行业类别的用电量波动对总用电量波动的影响值;根据各个用电行业类别的所述用电量占比和所述影响值大小,判断所述用电行业类别所包含的行业是否关键用电行业。

【技术特征摘要】
1.一种关键用电行业识别方法,其特征在于,包括如下步骤:获取预设时间段内待测区域中的各个行业的用电量统计数据;根据各个行业的用电量统计数据,运用聚类分析对各个行业进行用电分类,得到各个行业所属的用电行业类别;根据所述用电量统计数据和用电行业类别计算出各个用电行业类别的用电量占比;根据所述用电量统计数据和所述用电行业类别计算出各个用电行业类别的用电量波动对总用电量波动的影响值;根据各个用电行业类别的所述用电量占比和所述影响值大小,判断所述用电行业类别所包含的行业是否关键用电行业。2.根据权利要求1所述的关键用电行业识别方法,其特征在于,运用聚类分析对各个行业进行用电分类,得到各个行业所属的用电行业类别的步骤包括:随机设定数据集中的K个数据点作为初始聚类中心;其中,所述数据集包含若干个行业,每个行业的用电量统计数据序列有若干个数据点,每个数据点为预设时间段内的用电量统计数据;计算所述数据集中的每个数据点与各个聚类中心的欧几里得距离;将每个数据点归入与其距离最近的类别;计算每个分类中心各个数据点的均值作为新的聚类中心;判断数据点的类别划分是否发生变化,如果是,则输出聚类结果;否则,返回计算数据集中的每个数据点与各个聚类中心的欧几里得距离的步骤。3.根据权利要求2所述的关键用电行业识别方法,其特征在于,计算数据集中的每个数据点与各个聚类中心的欧几里得距离的步骤包括:计算各类别中的数据点到其聚类中心uk的距离平方和:其中,所述数据集包含n个行业,每个行业的用电量统计数据序列有d个数据点,每个数据点为预设时间段内的用电量统计数据,所述数据集表示为X={x1,x2,L,xi,Lxn},其中,将行业划分为C={c1,c2,L,ck,L,cK},ck为代表一个类别,每个类别都有一个中心uk,该中心为类别内各数据点的平均值。4.根据权利要求2所述的关键用电行业识别方法,其特征在于,计算数据集中的每个数据点与各个聚类中心的欧几里得距离的步骤包括:计算组间距离平方和与总体距离平方和的比值BSS/TSS;其中,所述数据集包含n个行业,每个行业的用电量统计数据序列有d个数据点,每个数据点为预设时间段内的用电量统计数据,所述数据集表示为X={x1,x2,L,xi,Lxn},其中,将行业划分为C={c1,c2,L,ck,L,cK},ck为代表一个类别,每个类别都有一个中心uk,该中心为类别内各对象的平均值。5.根据权利要求1所述的关键用电行业识别方法,其特征在于,根据各个行业的用电量统计数据...

【专利技术属性】
技术研发人员:宋艺航冷媛傅蔷陈政王玲张翔蒙文川席云华
申请(专利权)人:中国南方电网有限责任公司电网技术研究中心南方电网科学研究院有限责任公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1