电能表运行数据变量筛选方法、电子设备及存储介质技术

技术编号:38332230 阅读:38 留言:0更新日期:2023-07-29 09:15
本发明专利技术公开了一种电能表运行数据变量筛选方法、电子设备及存储介质,构建各时刻基本误差BE及基本误差BE对应下的变量集合;计算智能电表的基本误差向量中各时刻的基本误差与所述样本数据集合中各样本之间的最大信息系数,删除最大信息系数小于设定阈值的样本,剩余的样本构成变量集合;检测异常值,利用改进的加权欧式距离和SC、CH定量分析KNN的异常值检测结果,并利用检测的权值进行基本误差异常值修正;修正基本误差,将修正后的基本误差向量和变量集合进行第二步变量筛选,最终确定基本误差向量和变量集合。本发明专利技术不仅能有效科学的检测异常数据,保证数据的完整性,还能快速合理筛选不相关变量和联合变量,避免共线性问题。题。题。

【技术实现步骤摘要】
电能表运行数据变量筛选方法、电子设备及存储介质


[0001]本专利技术涉及电能表运行数据变量处理技术,特别是一种电能表运行数据变量筛选方法、电子设备及存储介质。

技术介绍

[0002]电能表在运行过程中,测量精度及可靠性主要受到环境因素温度、湿度等影响;此外,在沿海地区还会严重受到盐雾、风速等影响;在高海拔地区,受到海拔、光照等环境因素影响;电能表在测量不同电力时,也会受到不同程度的影响。在众多因素共同作用下,电能表测量精度及运行可靠性逐渐降低,然而部分因素的影响远远大于其他因素,且在同一地区的压强一直是较稳定的变量,各变量之间具有强相关性,将多个强相关变量带入模型常会导致共线性的问题。电能表作为智能电网的终端神经,研究其在多影响因素下的计量准确性和可靠性至关重要,电能表运行数据也会存在一定的异常值,异常值的存在将严重影响后续研究模型的收敛性,计算结果的可靠性。有学者、专家进行变量筛选、异常检测的研究,如下:
[0003]申请号为CN115346682A的专利技术专利申请公开了一种基于乳腺癌数据的变量筛选方法及系统、可读存储介质,属于医本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种电能表运行数据变量筛选方法,其特征在于,包括以下步骤:S1、构建各时刻基本误差BE及基本误差BE对应下的变量集合θ:θ=[T,R,P,V,W,YW,IP,t],其中,T、R、P、V、W、YW、IP、t分别表示温度、湿度、压强、光照、风速、盐雾、电力、时间;S2、计算智能电表的基本误差向量中各时刻的基本误差与所述样本数据集合中各样本之间的最大信息系数,删除最大信息系数小于设定阈值的样本,剩余的样本构成变量集合θ1;S3、利用下式修正基本误差BE:其中,为修正后的基本误差,w
s
表示第s个数据点的修正权重值,D
g,ω
(s)为第s个数据点到第g个数据点的加权欧式距离,权重ω
i
是基本误差与变量集合θ1中第i个变量之间的最大信息系数,x
s,i
表示数据点s在变量集合θ1中的第i个变量,x
g,i
表示数据点g在变量集合θ1中的第i个变量,y
s
为数据点s的基本误差,y
g
为数据点g的基本误差;n为变量集合θ1中的变量总数;将修正后的基本误差向量和变量集合θ1作为筛选的变量。2.根据权利要求1所述的电能表运行数据变量筛选方法,其特征在于,步骤S2中,最大信息系数计算公式为:其中,MIC(x,y)为最大信息系数;|X|,|Y|分别为在X方向和Y方向划分的网格段数;B设定为总网格数即|X||Y|的0.6次方,x、y均为随机变量,y对应基本误差向量中的基本误差,x对应样本数据集合θ中的样本,I(X,Y)为互信息。3.根据权利要求1所述的电能表运行数据变量筛选方法,其特征在于,判断数据点的基本误差是否正常的具体实现过程包括:1)设定邻近值k和异常比例m的区间;初始化k和m;其中,k为正整数,0<m≤1;2)计算当前数据点到其他每个数据点的加权欧式距离;3)对所有距离值排序,选择距离最小的k个邻近点,从k个邻近点中选出最大距离值;4)对于其余每个数据点,重复执行步骤2)和步骤3);遍历所有数据点后,得到M个距离值;M为数据点的数量;5)将M个距离值中距离大于阈值的...

【专利技术属性】
技术研发人员:覃玉红罗云吴想蒋志波唐韧博虞少嵚
申请(专利权)人:中国电建集团中南勘测设计研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1