基于数据挖掘的中低压配电网状态估计伪量测量确定方法技术

技术编号:18398701 阅读:27 留言:0更新日期:2018-07-08 19:26
本发明专利技术公开了一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法,属于配电网分析控制领域,包括:将城市地图划分为N个供电网格,利用网络数据采集方法收集N个供电网格内的电力用户信息,构成开源电力用户信息集;利用正则表达式对结构化数据和半结构化数据进行清洗,将非结构化数据转化为电力用户建筑信息,对清洗后的数据和电力用户建筑信息进行属性归约,得到电力用户的属性特征;根据电力用户的属性特征,利用正则表达式对电力用户进行集中等值分析,得到集中用户和不可集中用户;进而得到用户负荷功率,根据用户负荷功率得到伪量测数据。本发明专利技术有针对性地实现了数据资源的最大利用,准确高效地确定了配电网络中的伪量测量。

【技术实现步骤摘要】
基于数据挖掘的中低压配电网状态估计伪量测量确定方法
本专利技术属于配电网分析控制领域,更具体地,涉及一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法。
技术介绍
配电网状态估计是根据可获取的量测数据估算系统运行状态的方法,是配电网调度中心的基本功能。中低压配电网处于电力系统末端,具有地域分布广、电网规模大的特点,网络中的线路及设备数量远大于输电网,且量测设备较少,数据收集困难,因此,量测数据的获取及补充是开展中低压配电网状态估计的重要任务。量测数据主要分为实时量测和伪量测两种,对有量测装置的节点,可以直接读取量测值,对无量测装置的节点,通常采用负荷预测或对预想事故进行仿真的方法确定其负荷功率,添加伪量测数据,使系统可观测。但以上确定伪量测量的方法需要大量电力系统内部的历史数据,数据来源有局限性。目前,信息技术的高速发展产生了海量网络信息,催生出大数据,也使得数据来源更加广泛,形式更为多元,为增加量测盲区数据的冗余性,应充分利用快速发展的信息互联网资源,运用数据挖掘技术获取有价值的电力信息,及时补充电力负荷数据。数据挖掘的常用方法有回归分析、聚类、粗糙集和正则表达式等,但由于现代互联网应用呈现出非结构化和半结构化数据大幅度增长的特点,使通过网络获取的开源数据类型繁多,传统数据挖掘方法不再完全适用。由此可见,现有技术存在配电网中量测数据不完备、测量结果准确率低的技术问题。
技术实现思路
针对现有技术的以上缺陷或改进需求,本专利技术提供了一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法,由此解决现有技术存在配电网中量测数据不完备、测量结果准确率低的技术问题。为实现上述目的,本专利技术提供了一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法,包括:(1)将城市地图划分为N个供电网格,利用网络数据采集方法收集N个供电网格内的电力用户信息,构成开源电力用户信息集;(2)利用正则表达式对开源电力用户信息集中的结构化数据和半结构化数据进行清洗,将开源电力用户信息集中的非结构化数据转化为电力用户建筑信息,对清洗后的数据和电力用户建筑信息进行属性归约,得到电力用户的属性特征;(3)根据电力用户的属性特征,利用正则表达式对电力用户进行集中等值分析,得到集中用户和不可集中用户;(4)对于集中用户,根据电力用户建筑信息得到集中用户的负荷功率;对于不可集中用户,根据设计标准确定其建筑信息,进而得到不可集中用户的负荷功率,最后根据集中用户和不可集中用户的负荷功率得到伪量测数据。进一步的,步骤(1)的具体实现方式为:将城市地图划分为N个供电网格,根据供电网格的顶点经纬度得到能将供电网格包含在内的圆形检索区域的搜索中心和搜索半径,通过网络地图开放平台公开的PlaceAPI在圆形检索区域内收集电力用户基本信息,电力用户基本信息包括:名称、地址、一级行业分类、二级行业分类、经纬度坐标和电话信息,利用网络爬虫技术,根据电力用户名称,收集全国企业信用信息公示系统、国家知识产权局、商标局的电力用户开源关联信息,电力用户开源关联信息包括注册资本、营业期限、经营状态、经营范围、企业类型、注册地址和统一社会信用代码,电力用户基本信息和电力用户开源关联信息组成电力用户信息,N个供电网格内的电力用户信息,构成开源电力用户信息集。进一步的,非结构化数据为反映电力用户建筑信息的图片。进一步的,电力用户建筑信息包括长、宽、楼层数和建筑等级。进一步的,电力用户的属性特征包括名称、时间、空间和经济参数四类属性,所述名称类属性为名称,所述时间类属性包括营业起始年限、营业终止年限,所述空间类属性包括经度、纬度和地址,所述经济参数类属性包括一级行业分类和二级行业分类。进一步的,步骤(3)包括:(3a)电力用户的时间存在区间为[营业起始年限,营业终止年限],当被研究的电力用户的年份属于电力用户的时间存在区间时,该电力用户为时间存在用户;(3b)当时间存在用户在供电网格内,则该电力用户为时空存在用户;(3c)时空存在用户的集合构成数据集S,根据一级行业分类将S分为n类数据子集,并根据行业类别进行供电等级排序,按照供电等级由高到低排序后的数据子集依次为s1,s2,…,sn;(3d)对于数据子集s1,基于正则表达式对电力用户的名称进行模糊匹配判断,删除名称重复的电力用户即s1中的非集中用户,得到s1中的集中用户;(3e)对于数据子集si(i=2,…,n),根据名称类属性、空间类属性和经济参数类属性得到正关键字符和负关键字符,当数据子集si中的电力用户属性与正关键字符匹配或不与负关键字符匹配时,说明该用户为集中用户,由此得到si(i=2,…,n)中的集中用户和si(i=2,…,n)中的非集中用户,si(i=1,2,…,n)中的集中用户构成集中用户集S1;(3f)si(i=2,…,n)中的非集中用户构成用户集si’(i=2,…,n),用正则表达式对si’(i=2,…,n)中的地址和S1中的名称进行匹配判断,匹配失败时,得到不可集中用户集S2。总体而言,通过本专利技术所构思的以上技术方案与现有技术相比,能够取得下列有益效果:本专利技术提出了一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法,先用网络数据采集方法获取大量电力用户信息,然后利用正则表达式对开源信息集中的各类结构数据进行预处理,随后基于正则表达式进行电力用户的集中等值分析,基于分析结果,利用由非结构化数据转换和查阅设计标准得到的建筑信息计算用户负荷功率,从而完成配电网状态估计中伪量测量的确定。本专利技术有效利用互联网开源信息解决配电网中的数据来源难题,根据数据特征制定相应的数据挖掘方法,有针对性地实现了数据资源的最大利用,同时兼顾电力用户的属性特征,准确高效地确定了配电网络中的伪量测量。附图说明图1是本专利技术实施例提供的一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法的流程图;图2是本专利技术实施例提供的数据仓库模型的示意图;图3是本专利技术实施例1提供的供电网格的地图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。此外,下面所描述的本专利技术各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。如图1所示,一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法,包括:(1)将城市地图划分为N个供电网格,根据供电网格的顶点经纬度得到能将供电网格包含在内的圆形检索区域的搜索中心和搜索半径,通过网络地图开放平台公开的PlaceAPI在圆形检索区域内收集电力用户基本信息,电力用户基本信息包括:名称、地址、一级行业分类、二级行业分类、经纬度坐标和电话信息,利用网络爬虫技术,根据电力用户名称,收集全国企业信用信息公示系统、国家知识产权局、商标局的电力用户开源关联信息,电力用户开源关联信息包括注册资本、营业期限、经营状态、经营范围、企业类型、注册地址和统一社会信用代码,电力用户基本信息和电力用户开源关联信息组成电力用户信息,N个供电网格内的电力用户信息,构成开源电力用户信息集。(2)利用正则表达式对开源电力用户信息集中的结构化数据和半结构化数据进行清洗,将开源电力用户信息集中的非结构化数本文档来自技高网...

【技术保护点】
1.一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法,其特征在于,包括:(1)将城市地图划分为N个供电网格,利用网络数据采集方法收集N个供电网格内的电力用户信息,构成开源电力用户信息集;(2)利用正则表达式对开源电力用户信息集中的结构化数据和半结构化数据进行清洗,将开源电力用户信息集中的非结构化数据转化为电力用户建筑信息,对清洗后的数据和电力用户建筑信息进行属性归约,得到电力用户的属性特征;(3)根据电力用户的属性特征,利用正则表达式对电力用户进行集中等值分析,得到集中用户和不可集中用户;(4)对于集中用户,根据电力用户建筑信息得到集中用户的负荷功率;对于不可集中用户,根据设计标准确定其建筑信息,进而得到不可集中用户的负荷功率,最后根据集中用户和不可集中用户的负荷功率得到伪量测数据。

【技术特征摘要】
1.一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法,其特征在于,包括:(1)将城市地图划分为N个供电网格,利用网络数据采集方法收集N个供电网格内的电力用户信息,构成开源电力用户信息集;(2)利用正则表达式对开源电力用户信息集中的结构化数据和半结构化数据进行清洗,将开源电力用户信息集中的非结构化数据转化为电力用户建筑信息,对清洗后的数据和电力用户建筑信息进行属性归约,得到电力用户的属性特征;(3)根据电力用户的属性特征,利用正则表达式对电力用户进行集中等值分析,得到集中用户和不可集中用户;(4)对于集中用户,根据电力用户建筑信息得到集中用户的负荷功率;对于不可集中用户,根据设计标准确定其建筑信息,进而得到不可集中用户的负荷功率,最后根据集中用户和不可集中用户的负荷功率得到伪量测数据。2.如权利要求1所述的一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法,其特征在于,所述步骤(1)的具体实现方式为:将城市地图划分为N个供电网格,根据供电网格的顶点经纬度得到将供电网格包含在内的圆形检索区域的搜索中心和搜索半径,通过网络地图开放平台公开的PlaceAPI在圆形检索区域内收集电力用户基本信息,电力用户基本信息包括:名称、地址、一级行业分类、二级行业分类、经纬度坐标和电话信息,利用网络爬虫技术,根据电力用户名称,收集全国企业信用信息公示系统、国家知识产权局、商标局的电力用户开源关联信息,电力用户开源关联信息包括注册资本、营业期限、经营状态、经营范围、企业类型、注册地址和统一社会信用代码,电力用户基本信息和电力用户开源关联信息组成电力用户信息,N个供电网格内的电力用户信息,构成开源电力用户信息集。3.如权利要求1或2所述的一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法,其特征在于,所述非结构化数据为反映电力用户建筑信息的图片。4.如权利要求1或2所述的一种基于数...

【专利技术属性】
技术研发人员:谢伟张勇凌平李妍刘婉兵杨晨光杨秉臻王少荣任嘉鑫刘一鸣
申请(专利权)人:国网上海市电力公司华中科技大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1