【技术实现步骤摘要】
一种变压器负荷数据预处理方法、装置和设备
本申请涉及数据处理
,尤其涉及一种变压器负荷数据预处理方法、装置和设备。
技术介绍
变压器是电力系统中的关键一环,在当今电力物联网建设背景之下,设备运行监测数据作为感知层的主要信息,是数据分析处理和数据挖掘的重要基础,但变压器运行所处的环境复杂多样,数据采集设备具有不稳定性,人工采集的数据也会由于误操作产生误差,使得采集的变压器负荷数据存在“脏数据”,数据质量不高,而直接将采集的变压器负荷数据作为有效数据集输入到相关故障预测、负荷预测及其他数据分析模型进行分析,会导致分析结果不够准确。
技术实现思路
本申请提供了一种变压器负荷数据预处理方法、装置和设备,用于解决现有的变压器负荷数据数据由于采集设备具有不稳定性和人工采集数据时的误操作,使得采集的变压器负荷数据存在“脏数据”,数据质量不高的技术问题。有鉴于此,本申请第一方面提供了一种变压器负荷数据预处理方法,包括:通过变电站在线监测设备获取变压器负荷数据,得到初始负荷数据集;计算所述初始 ...
【技术保护点】
1.一种变压器负荷数据预处理方法,其特征在于,包括:/n通过变电站在线监测设备获取变压器负荷数据,得到初始负荷数据集;/n计算所述初始负荷数据集中各个数据对象的k近邻密度波动孤立因子,其中,k为正整数;/n当所述数据对象的k近邻密度波动孤立因子的值大于孤立因子阈值时,判定所述数据对象为孤立点,并删除所述孤立点,得到处理后的负荷数据集;/n在所述处理后的负荷数据集中选取若干个所述数据对象作为基础集,并对所述基础集进行过采样,得到新的数据集;/n将所述新的数据集和所述处理后的负荷数据集合并后输出。/n
【技术特征摘要】
1.一种变压器负荷数据预处理方法,其特征在于,包括:
通过变电站在线监测设备获取变压器负荷数据,得到初始负荷数据集;
计算所述初始负荷数据集中各个数据对象的k近邻密度波动孤立因子,其中,k为正整数;
当所述数据对象的k近邻密度波动孤立因子的值大于孤立因子阈值时,判定所述数据对象为孤立点,并删除所述孤立点,得到处理后的负荷数据集;
在所述处理后的负荷数据集中选取若干个所述数据对象作为基础集,并对所述基础集进行过采样,得到新的数据集;
将所述新的数据集和所述处理后的负荷数据集合并后输出。
2.根据权利要求1所述的变压器负荷数据预处理方法,其特征在于,所述计算所述初始负荷数据集中各个数据对象的k近邻密度波动孤立因子,包括:
根据所述初始负荷数据集中各个数据对象的k-距离,确定各个所述数据对象的k-距离邻域;
基于所述k-距离和所述k-距离邻域计算各个所述数据对象的k近邻密度;
根据各个所述数据对象间的k-距离的大小,对各个所述k-距离邻域中的所述数据对象进行升序排序;
基于所述k近邻密度计算排序后各个所述数据对象的k近邻密度波动平均值,并基于所述k近邻密度波动平均值计算各个所述数据对象的k近邻密度波动孤立因子。
3.根据权利要求1所述的变压器负荷数据预处理方法,其特征在于,所述在所述处理后的负荷数据集中选取若干个所述数据对象作为基础集,包括:
在所述处理后的负荷数据集中随机选取若干个所述数据对象作为基础集,其中,所述基础集中的所述数据对象的数量与删除的所述孤立点的数量相等。
4.根据权利要求1所述的变压器负荷数据预处理方法,其特征在于,所述对所述基础集进行过采样,得到新的数据集,包括:
根据所述基础集中各个所述数据对象间的欧式距离,确定各个所述数据对象的k近邻;
基于预置采样率,从各所述数据对象的k近邻中随机抽取近邻点数据,并基于预置公式对各个所述近邻点数据进行处理,得到新的数据集。
5.根据权利要求4所述的变压器负荷数据预处理方法,其特征在于,所述预置公式为:
xnew_i=xi+rand(0,1)*|xi-xk_i|,i=1,2,…,n;
其中,xnew_i为生成的第i个新数据对象,rand(0,1)为在区间(0,1)内生成随机数的函数,xi为第i个数据对象,xk_i为第i个数据对象的k近邻中随机抽取的近邻点数据,n为基础集中数据对象的数量。
6.一种变压器负荷数据预处理装置,其特征在于,...
【专利技术属性】
技术研发人员:栾乐,莫文雄,王红斌,饶毅,马捷然,许中,罗思敏,罗林欢,陈剑,刘俊翔,马智远,刘田,范伟男,
申请(专利权)人:广东电网有限责任公司广州供电局,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。