一种变压器负荷数据预处理方法、装置和设备制造方法及图纸

技术编号:26504701 阅读:22 留言:0更新日期:2020-11-27 15:32
本申请公开了一种变压器负荷数据预处理方法、装置和设备,方法包括:通过变电站在线监测设备获取变压器负荷数据,得到初始负荷数据集;计算初始负荷数据集中各个数据对象的k近邻密度波动孤立因子,其中,k为正整数;当数据对象的k近邻密度波动孤立因子的值大于孤立因子阈值时,判定数据对象为孤立点,并删除孤立点,得到处理后的负荷数据集;在处理后的负荷数据集中选取若干个数据对象作为基础集,并对基础集进行过采样,得到新的数据集;将新的数据集和处理后的负荷数据集合并后输出,解决了现有的变压器负荷数据数据由于采集设备具有不稳定性和人工采集数据时的误操作,使得采集的变压器负荷数据存在“脏数据”,数据质量不高的技术问题。

【技术实现步骤摘要】
一种变压器负荷数据预处理方法、装置和设备
本申请涉及数据处理
,尤其涉及一种变压器负荷数据预处理方法、装置和设备。
技术介绍
变压器是电力系统中的关键一环,在当今电力物联网建设背景之下,设备运行监测数据作为感知层的主要信息,是数据分析处理和数据挖掘的重要基础,但变压器运行所处的环境复杂多样,数据采集设备具有不稳定性,人工采集的数据也会由于误操作产生误差,使得采集的变压器负荷数据存在“脏数据”,数据质量不高,而直接将采集的变压器负荷数据作为有效数据集输入到相关故障预测、负荷预测及其他数据分析模型进行分析,会导致分析结果不够准确。
技术实现思路
本申请提供了一种变压器负荷数据预处理方法、装置和设备,用于解决现有的变压器负荷数据数据由于采集设备具有不稳定性和人工采集数据时的误操作,使得采集的变压器负荷数据存在“脏数据”,数据质量不高的技术问题。有鉴于此,本申请第一方面提供了一种变压器负荷数据预处理方法,包括:通过变电站在线监测设备获取变压器负荷数据,得到初始负荷数据集;计算所述初始负荷数据集中各个数据本文档来自技高网...

【技术保护点】
1.一种变压器负荷数据预处理方法,其特征在于,包括:/n通过变电站在线监测设备获取变压器负荷数据,得到初始负荷数据集;/n计算所述初始负荷数据集中各个数据对象的k近邻密度波动孤立因子,其中,k为正整数;/n当所述数据对象的k近邻密度波动孤立因子的值大于孤立因子阈值时,判定所述数据对象为孤立点,并删除所述孤立点,得到处理后的负荷数据集;/n在所述处理后的负荷数据集中选取若干个所述数据对象作为基础集,并对所述基础集进行过采样,得到新的数据集;/n将所述新的数据集和所述处理后的负荷数据集合并后输出。/n

【技术特征摘要】
1.一种变压器负荷数据预处理方法,其特征在于,包括:
通过变电站在线监测设备获取变压器负荷数据,得到初始负荷数据集;
计算所述初始负荷数据集中各个数据对象的k近邻密度波动孤立因子,其中,k为正整数;
当所述数据对象的k近邻密度波动孤立因子的值大于孤立因子阈值时,判定所述数据对象为孤立点,并删除所述孤立点,得到处理后的负荷数据集;
在所述处理后的负荷数据集中选取若干个所述数据对象作为基础集,并对所述基础集进行过采样,得到新的数据集;
将所述新的数据集和所述处理后的负荷数据集合并后输出。


2.根据权利要求1所述的变压器负荷数据预处理方法,其特征在于,所述计算所述初始负荷数据集中各个数据对象的k近邻密度波动孤立因子,包括:
根据所述初始负荷数据集中各个数据对象的k-距离,确定各个所述数据对象的k-距离邻域;
基于所述k-距离和所述k-距离邻域计算各个所述数据对象的k近邻密度;
根据各个所述数据对象间的k-距离的大小,对各个所述k-距离邻域中的所述数据对象进行升序排序;
基于所述k近邻密度计算排序后各个所述数据对象的k近邻密度波动平均值,并基于所述k近邻密度波动平均值计算各个所述数据对象的k近邻密度波动孤立因子。


3.根据权利要求1所述的变压器负荷数据预处理方法,其特征在于,所述在所述处理后的负荷数据集中选取若干个所述数据对象作为基础集,包括:
在所述处理后的负荷数据集中随机选取若干个所述数据对象作为基础集,其中,所述基础集中的所述数据对象的数量与删除的所述孤立点的数量相等。


4.根据权利要求1所述的变压器负荷数据预处理方法,其特征在于,所述对所述基础集进行过采样,得到新的数据集,包括:
根据所述基础集中各个所述数据对象间的欧式距离,确定各个所述数据对象的k近邻;
基于预置采样率,从各所述数据对象的k近邻中随机抽取近邻点数据,并基于预置公式对各个所述近邻点数据进行处理,得到新的数据集。


5.根据权利要求4所述的变压器负荷数据预处理方法,其特征在于,所述预置公式为:
xnew_i=xi+rand(0,1)*|xi-xk_i|,i=1,2,…,n;
其中,xnew_i为生成的第i个新数据对象,rand(0,1)为在区间(0,1)内生成随机数的函数,xi为第i个数据对象,xk_i为第i个数据对象的k近邻中随机抽取的近邻点数据,n为基础集中数据对象的数量。


6.一种变压器负荷数据预处理装置,其特征在于,...

【专利技术属性】
技术研发人员:栾乐莫文雄王红斌饶毅马捷然许中罗思敏罗林欢陈剑刘俊翔马智远刘田范伟男
申请(专利权)人:广东电网有限责任公司广州供电局
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1