一种电力系统异常用户的识别方法技术方案

技术编号:17797088 阅读:41 留言:0更新日期:2018-04-25 20:36
本发明专利技术公开了一种电力系统异常用户的识别方法,其特征在于,包括以下步骤:欧式距离的获取;用户地址与台区地址特征词相似度的获取;用户历史用电负荷的余弦距离;用户异常概率的计算和用户异常的识别。本发明专利技术通过简单的步骤,实现了通过地理位置信息数据、地址名称以及用电负荷识别是否为异常用户,提高了电力系统的工作效率。

An identification method for abnormal users of power system

The invention discloses a method for identifying the abnormal users of the power system, which includes the following steps: the acquisition of Euclidean distance, the acquisition of the similarity between the user address and the address feature word of the platform area, the cosine distance of the user's historical power load, the calculation of the user anomaly probability and the identification of the user anomaly. Through simple steps, the invention improves the efficiency of the power system by realizing the geographic information data, the address name and the power load identification as an abnormal user.

【技术实现步骤摘要】
一种电力系统异常用户的识别方法
本专利技术属于电力系统用户异常的识别
,具体涉及一种电力系统异常用户的识别方法。
技术介绍
随着用电信息采集系统的建设和应用,台区线损的管理逐步要求实现精细化,户变关系的准确性,不仅是用电信息采集系统实现远程抄表的基础,也是台区线损统计,准确分析的保障,无法掌握正确的户变关系,不仅影响用电信息采集系统抄表成功率,更是影响着台区线损分析的开展。因此,梳理户变关系识别异常用户对于电力企业有着重要的意义。在电力系统中,台区是指(一台)变压器的供电范围或区域。一个台区的供电范围或区域一般是以村、小区等为单位,供电用户在地图上相距较近,户变关系指台区和用户的所属关系。现有的电力系统异常用户识别通常采用人工识别法和瞬时停电法,人工识别法根据低压线路的走向进行户变关系的划分与异常识别,人为主观性较强,特别是城网内纵横交错的低压电力线走向,户变关系的划分非常复杂,对于有问题的台区户变关系识别异常用户也非常困难。瞬时停电法就是通过对各个变压器或各段母排在一段时间内(一般10秒)停电一次,且每台变压器的停电时间间隔在10分钟以上,然后利用掌机抄读智能电能表的掉电记录。根据电能表停电时间和变压器对应的停电时间即可区分每块电能表与台区的隶属关系。该方法具有较多的局限性,它要求台区下必须全部具备智能表,停电时,要求记录公用配变的停电时间,要求配置手持终端(即掌机),采用红外接口将智能表的停电时间秒读后传回系统进行判定,最后还要求配有台区户变关系的服务器。上述的分析方法能够在一定程度上进行台区户变关系异常识别,但分析结果往往并不理想,且实际应用价值较小,主要原因分析如下:现有相关技术多是基于人工主数据管理的,依靠人工根据低压线路的走向进行户变关系划分判断,人为主观性较强,或者通过停运变压器判断,该方法工程巨大费时费力,前期停电通知工作不到位的情况下还可能导致民事纠纷。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种电力系统异常用户的识别方法,通过地理位置信息、地址名称和用电负荷来判断是否为异常用户,便于电力系统的业务统计。为了实现上述目的,本专利技术通过以下技术方案予以实现:一种电力系统异常用户的识别方法,包括以下步骤:欧式距离的获取:获取台区每个用户的地理位置信息,通过计算获得每个用户的地理位置信息与台区地理位置信息的欧式距离;用户地址与台区地址特征词相似度的获取:获取台区内每个用户的地址和台区地址特征词,对比每个用户的地址和台区地址特征词,得到每个用户地址与台区地址特征词的相似度;用户历史用电负荷的余弦距离:通过两步聚类算法,将每个用户的历史用电负荷数据自动聚为若干类,求每一个用户历史用电负荷与相应类中心的余弦距离;用户异常概率的计算:通过熵权法,根据欧式距离、用户地址与台区地址的相似度以及用户历史用电负荷的余弦距离,计算得到每个用户的异常概率;用户异常的识别:通过每个用户的异常概率,识别获得电力系统中的异常用户。进一步地,所述欧式距离的获取步骤中,还包括用户到台区距离的处理,具体为:将每个用户到台区的距离通过归一化处理,获得每个用户与台区的距离。进一步地,所述用户到台区距离的处理中,归一化处理后,获得若干0-1之间的数据,其中,1表示所述用户与台区的距离最远。进一步地,所述用户地址与台区地址相似度的获取步骤中所述台区地址特征词的获取具体为:利用自然语言处理的名词得到地址名称词库,结合地址名称词库与台区内用户的地址得到台区地址特征词。进一步地,所述台区地址特征词的获取采用的是正则表达式。进一步地,所述地址名称词库至少包括村、小区、街、路、社区、巷、弄或公园中的一种。进一步地,所述用户地址与台区地址特征词相似度的获取步骤还包括对获得的用户地址与台区地址特征词相似度进行归一化处理。更进一步地,若获得的台区地址特征词为若干个,则所述台区内用户地址与台区地址特征词的相似度为所述用户的地址分别和若干个台区地址特征词对比之后得到的相似度的总和。进一步地,所述用户地址与台区地址特征词相似度的获取步骤中,所述每个用户地址与台区地址特征词的相似度采用向量空间模型方法获得。进一步地,所述用户异常概率的计算步骤中,所述通过熵权法具体为:a.将k个指标的数据进行标准化处理,具体为:给定的k个指标分别为X1,X2,...,Xk,且Xi={xi1,xi2,...xin},其中,k为3,所述k个指标分别是欧式距离、用户地址与台区地址相似度以及用户历史用电负荷的余弦距离;Xi表示第i个指标,i为1、2或3,第i个指标包括n个指标值xi1,xi2,...xin,n为大于等于1的自然数;将所述指标X1,X2,...,Xk标准化处理后的值分别为Y1,Y2,...Yk,其中,其中,xij表示第i类指标中n个数值中的第j个指标值,yij表示xij标准化处理后的结果值;b.分别求各个指标的信息熵:采用公式(1)计算各个指标的信息熵:其中pij表示第i类指标中第j个指标值在第i类指标的n个数据中占的比重,表示第i类指标中n个指标值标准化结果的加和,如果pij=0,则定义limpijlnpij=0;c.确定各指标权重:根据信息熵的计算公式,计算出各个指标的信息熵E1,E2,...,Ek。通过公式(2)计算得到各指标的权重:其中,Ei为第i个指标信息熵,∑Ei为中k个指标值信息熵的总和,k为指标个数。本专利技术的有益效果如下:本专利技术提出一种基于自然语言处理及机器学习的电力系统户变关系异常识别方法。其主要思路是:首先整理台区和用户的GIS数据,求取每个用户GIS与台区GIS的欧式距离,将台区所有用户的距离归一化到0到1之间,1表示距离最远;然后通过自然语言处理的分词得到地址名称词库,利用正则表达式求取每个台区用户地址的特征词,利用向量空间模型求取台区内每个用户地址与台区地址特征词之间的相似度,若有多个特征词,则对相似度数据求和,台区所有用户的相似度转换到0到1之间,1表示相似度最小;之后,通过两步聚类算法将台区用户的历史用电负荷数据自动聚为若干类,求每一个用户历史用电负荷与相应类中心的余弦距离,将台区所有用户的距离归一化到0到1之间,1表示距离最大;最后,利用熵权法根据GIS距离、名称相似度、用电负荷距离,综合得到每个用户的异常概率,进而得到台区中异常用户候选名单。本专利技术中,通过简单的计算步骤,结合现有的GIS系统,及时获取用户地理位置信息,判断是否异常,无需停运变压器,节省了大量的人力和物力,无需停电影响用户使用。附图说明图1为本专利技术提供的一种电力系统异常用户的识别方法的流程示意图;图2为本专利技术提供的聚类算法中的归属示意图。具体实施方式为了使本专利技术实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合实施例,进一步阐述本专利技术。参照附图1所示,本专利技术提供的一种电力系统异常用户的识别方法,包括以下步骤:1)欧式距离的获取:整理台区和用户的GIS数据,GIS包括经度数据和纬度数据,进而得到台区每个用户的地理位置信息,进而通过计算获得每用户地理位置信息与台区地理位置信息的欧式距离;当无法具体到用户的地理位置信息GIS时,可以用表箱的GIS代替用户的GIS;关于台区的地理位置,由于每个台区都会有经纬度,用户的经纬度用所在表箱的经纬度代替。本文档来自技高网
...
一种电力系统异常用户的识别方法

【技术保护点】
一种电力系统异常用户的识别方法,其特征在于,包括以下步骤:欧式距离的获取:获取台区每个用户的地理位置信息,通过计算获得每个用户的地理位置信息与台区地理位置信息的欧式距离;用户地址与台区地址特征词相似度的获取:获取台区内每个用户的地址和台区地址特征词,对比每个用户的地址和台区地址特征词,得到每个用户地址与台区地址特征词的相似度;用户历史用电负荷的余弦距离:通过两步聚类算法,将每个用户的历史用电负荷数据自动聚为若干类,求每一个用户历史用电负荷与相应类中心的余弦距离;用户异常概率的计算:通过熵权法,根据欧式距离、用户地址与台区地址的相似度以及用户历史用电负荷的余弦距离,计算得到每个用户的异常概率;用户异常的识别:通过每个用户的异常概率,识别获得电力系统中的异常用户。

【技术特征摘要】
1.一种电力系统异常用户的识别方法,其特征在于,包括以下步骤:欧式距离的获取:获取台区每个用户的地理位置信息,通过计算获得每个用户的地理位置信息与台区地理位置信息的欧式距离;用户地址与台区地址特征词相似度的获取:获取台区内每个用户的地址和台区地址特征词,对比每个用户的地址和台区地址特征词,得到每个用户地址与台区地址特征词的相似度;用户历史用电负荷的余弦距离:通过两步聚类算法,将每个用户的历史用电负荷数据自动聚为若干类,求每一个用户历史用电负荷与相应类中心的余弦距离;用户异常概率的计算:通过熵权法,根据欧式距离、用户地址与台区地址的相似度以及用户历史用电负荷的余弦距离,计算得到每个用户的异常概率;用户异常的识别:通过每个用户的异常概率,识别获得电力系统中的异常用户。2.根据权利要求1所述的一种电力系统异常用户的识别方法,其特征在于,所述欧式距离的获取步骤中,还包括每个用户到台区距离的处理,具体为:将每个用户到台区的距离通过归一化处理,获得每个用户与台区的距离。3.根据权利要求2所述的一种电力系统异常用户的识别方法,其特征在于,所述用户到台区距离的处理中,归一化处理后,获得若干0-1之间的数据,其中,1表示所述用户与台区的距离最远。4.根据权利要求1所述的一种电力系统异常用户的识别方法,其特征在于,所述用户地址与台区地址相似度的获取步骤中所述台区地址特征词的获取具体为:利用自然语言处理的名词得到地址名称词库,结合地址名称词库与台区内用户的地址得到台区地址特征词。5.根据权利要求4所述的一种电力系统异常用户的识别方法,其特征在于,所述台区地址特征词的获取采用的是正则表达式。6.根据权利要求4所述的一种电力系统异常用户的识别方法,其特征在于,所述地址名称词库至少包括村、小区、街、路、社区、巷、弄或公园中的一种。7.根据权利要求4所述的一种电力系统异常用户的识别方法,其特征在于,所述用户地址与台区地址特征词相似度的获取步骤还包括对获得的用户地址与台区地址特征词相似度进行归一化...

【专利技术属性】
技术研发人员:程宏亮刘宏胡辉杨文
申请(专利权)人:美林数据技术股份有限公司
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1