一种输变电运检数据质量评估方法及系统技术方案

技术编号:25439666 阅读:43 留言:0更新日期:2020-08-28 22:27
本发明专利技术为了现有技术中存在的问题,创新提出了一种输变电运检数据质量评估方法,从有效性、冗余度、信息量、完整性以及准确性等维度分别建立评估模型,用于评价输变电设备运检数据质量;基于无效比建立数据有效性评估模型;基于重复率建立数据冗余度评估模型;基于逻辑斯蒂增长模型建立数据信息量评估模型;基于相对缺失信息量建立数据完整性评估模型;基于加权局部因子算法以及异常度建立准确性评估模型,本发明专利技术还提出了一种输变电运检数据质量评估系统,有效解决由于现有数据质量评价单一、不够全面的问题,有效的提高了输变电设备运检数据质量的综合评估效果以及评估可靠性。

【技术实现步骤摘要】
一种输变电运检数据质量评估方法及系统
本专利技术涉及数据质量评估领域,尤其是涉及一种输变电运检数据质量评估方法及系统。
技术介绍
随着电网规模快速发展,电网容量正在持续扩大,输变电设备运检数据量呈指数级增长,庞大的设备数量和有限的人力之间的矛盾会越来越大,传统的以人工获取信息为主的工作方式已不能适应电网设备智能化运检的发展要求,亟需智能感知技术手段提高保证数据准确性、完整性以及工作效率。在大数据时代下,输变电设备运检数据具有多样性、丰富性的特点,海量的数据为输变电设备状态评估提供了数据支撑,但同时也对传统的数据管理、数据质量模式提出了更高的要求。如何建立数据质量评估模型,提高输变电设备运检数据的质量,对设备状态评估意义重大。现有技术中的数据质量评估模型一方面,对于数据质量的评价指标较为单一,无法从多个方面进行数据质量的评价;另一方面,数据质量评价指标并不能反映数据的信息量、完整性以及准确性,对于数据质量的评价,不够全面,不利于输变电设备运检数据质量的综合评估。
技术实现思路
本专利技术为了解决现有技术本文档来自技高网...

【技术保护点】
1.一种输变电运检数据质量评估方法,其特征是,包括:/n获取输变电设备运检数据;/n针对获取的输变电设备运检数据分别从多个维度建立评估模型进行数据质量的评估;/n其中,维度包括有效性、冗余度、信息量、完整性以及准确性;基于无效比建立数据有效性评估模型;基于重复率建立数据冗余度评估模型;基于逻辑斯蒂增长模型建立数据信息量评估模型;基于相对缺失信息量建立数据完整性评估模型;基于加权局部因子算法以及异常度建立准确性评估模型。/n

【技术特征摘要】
1.一种输变电运检数据质量评估方法,其特征是,包括:
获取输变电设备运检数据;
针对获取的输变电设备运检数据分别从多个维度建立评估模型进行数据质量的评估;
其中,维度包括有效性、冗余度、信息量、完整性以及准确性;基于无效比建立数据有效性评估模型;基于重复率建立数据冗余度评估模型;基于逻辑斯蒂增长模型建立数据信息量评估模型;基于相对缺失信息量建立数据完整性评估模型;基于加权局部因子算法以及异常度建立准确性评估模型。


2.根据权利要求1所述的输变电运检数据质量评估方法,其特征是,基于无效比建立数据有效性评估模型具体是:
基于无效比建立数据有效性评估模型:



其中,Score1为数据有效性得分,αinv为数据无效比,表达式为:无效点为输变电设备监测数据中某项记录数据中全部为0或者某项记录数据中存在小于0的数据,有效点为输变电设备监测数据中某项记录数据中不全为0或者某项记录数据中不存在小于0的数据,θ1为第一曲线斜率参数。


3.根据权利要求1所述的输变电运检数据质量评估方法,其特征是,基于重复率建立数据冗余度评估模型具体是:
基于重复率建立数据冗余度评估模型:



其中,Score2为数据冗余度得分,αry为数据重复率,表达式为:重复记录为输变电设备监测数据中多项连续记录数据完全相同或者多项记录数据中记录时间完全相同,有效记录为为输变电设备监测数据中多项连续记录数据不完全相同或者多项记录数据中记录时间不完全相同,θ2为第二曲线斜率参数。


4.根据权利要求1所述的输变电运检数据质量评估方法,其特征是,基于逻辑斯蒂增长模型建立数据信息量评估模型具体包括:
基于逻辑斯蒂增长模型建立数据信息量评估模型:



其中,Score3为数据信息量得分,c为第三曲线第一斜率参数,r1为第三曲线第二斜率参数,avgI为平均信息量,表达式为:



其中,V为第一数据集,I(x)为数据点x的信息量。


5.根据权利要求4所述的输变电运检数据质量评估方法,其特征是,所述I(x)表达式具体为:I(x)=-log2p(x),其中,p(x)为监测时间天数t对应的数据点x出现的概率,表达式为:



数据点xi对应于归一化处理后的数据点x,ui为正态分布的监测时间天数为ti对应的数据点xi的均值,σi为正态分布的监测时间天数为ti对应的数据点xi的标准差,






(xi-1,ti-1)和(xi+1,ti+1)分别为距离(xi,ti)最近的前后两个有效监测点,neighbor(xi)表示[ti-3,ti+3]时间段内有效监测点的集合,μnei为neighbor(xi)中所有数据点的均值,mi为[ti-3,ti+3]时间段内没有有效监测点的天数,表达式为mi=7-|neighbor(xi)|,validdata表示所有有效监测点的集合,其中,有效监测点为所在数据点没有重复监测记录、全0监测记录或监测值与均值距离不超过3倍样本方差的监测记录。


6.根据权利要求5所述的输变电运检数据质量评估方法,其特征是,基于相对缺失信息量建立数据完整性评估模型具体包括:
基于相对缺失信息量建立数据完整性评估模型:



其中,Score4为数据完整性评估得分,r2为第四曲线斜率参数,relI为相对缺失信息量,表达式为,



I(xi)为数据点xi的信息量,miss为数...

【专利技术属性】
技术研发人员:秦佳峰杨祎辜超白德盟崔其会郑文杰林颖李程启刘萌吕学宾黄锐吕俊涛陈令英周超李龙龙孙景文李杰高建峰
申请(专利权)人:国网山东省电力公司电力科学研究院国家电网有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1