基于边缘计算改进KNN的配网电气拓扑识别方法及系统技术方案

技术编号:27206202 阅读:86 留言:0更新日期:2021-01-31 12:29
本发明专利技术公开了基于边缘计算改进KNN的配网电气拓扑识别方法及系统,涉及配电网领域中的拓扑辨识技术领域,包括步骤:S1获取用户电压数据并记为数据集A;S2对数据集A划分训练集和测试集,进行均值填充处理,记为训练集B和测试集C;S3改进KNN分类算法,取测试集C中的样本与训练集B计算,确定测试集C中该样本所属相别;S4将测试集C中已测试的样本添加到训练集B做更新,并记为训练集D;S5重复的S3步骤,将测试集C中的下一个样本与训练集D计算,确定测试集C中下一个样本所属相别;S6重复S4步骤的训练集更新与S3步骤的分类计算,得到测试集C所有所属相别,克服了目前存在的拓扑辨识效率不高和采集主站数据处理压力过大的问题。和采集主站数据处理压力过大的问题。和采集主站数据处理压力过大的问题。

【技术实现步骤摘要】
基于边缘计算改进KNN的配网电气拓扑识别方法及系统


[0001]本专利技术涉及配电网中拓扑辨识
,具体涉及基于边缘计算改进KNN的配网电气拓扑识别方法及系统。

技术介绍

[0002]目前,配电网拓扑识别技术即判断低压用户对应台区及相位的主要方法有三类:第一是停电入户进行排查。这种方法比较传统,需要耗费大量人力,效率低,速度慢,人工核查后需进行手工录入,无法做到直接统一的数字化存储,使用范围有局限。第二是利用载波等无线通信方式进行识别,通过利用不同载波方式进行识别,这些方法需要额外加装硬件设施进行通信传输,对于用户量巨大的低压台区,前期工程量耗资较大,且在强磁场等信号干扰时,通信信号会衰减或受到干扰,导致识别结果准确率低。第三则是利用智能电能电表自身采集大量数据进行算法识别。
[0003]但目前提出的利用电能电表采集数据进行算法识别存在如下问题:
[0004](1)需已知变压器低压侧电压数据作为聚类中心,适用场景受限;
[0005](2)运算量较大且数据量太少时无法实现准确识别;
[0006](3)主要依靠不同台区之间的相关性实现电气拓扑识别,需要提前对台区进行分类,适用场景受限。

技术实现思路

[0007]有鉴于此,本专利技术提供基于边缘计算改进KNN的配网电气拓扑识别方法及系统,目的在于,基于边缘计算技术,克服现有技术中存在的拓扑辨识效率不高和采集主站数据处理压力过大的缺陷。
[0008]本专利技术通过下述技术方案实现:
[0009]基于边缘计算改进KNN的配网电气拓扑识别方法,包括以下步骤;
[0010]S1:获取一个台区单元的各个电表单元用户电压数据并记为数据集A;
[0011]S2:对所述数据集A划分训练集和测试集,对所述训练集和测试集的缺失值进行均值填充处理,将均值填充处理后的训练集记为训练集B,将均值填充后的测试集记为测试集C;
[0012]S3:对KNN分类算法做改进,选用皮尔逊相关系数作为数据距离度量标准,取测试集C中的样本与训练集B对比进行分类计算,确定测试集C中该样本所属相别;
[0013]S4:将测试集C中已确定所属相别的样本添加到训练集B对训练集B做更新,并记为训练集D;
[0014]S5:重复所述的S3步骤,将测试集C中的下一个样本与所述训练集D对比进行分类计算,最终确定测试集C中下一个样本所属相别;
[0015]S6:重复所述S4步骤的训练集更新与所述S3步骤的分类计算,直至测试集C中的所有样本全部得到所属相别。
[0016]在本方案中,在各个电表对用户数据进行采集时,随着低压用户量的不断增长,数据采集过程中采集的同时性和坏数据等问题较为显著,因此通过电表单元对数据集中的数据进行均值填充缺失值,减少异常数据对后续处理过程的干扰,提高了拓扑辨识的准确率;由于欧式距离度量的是空间上的绝对距离,故在此场景受限。本算法的原理为:同一台区同一相位的电压曲线相似性大于同一台区不同相位,故采用皮尔逊相关系数,避免了传输过程中引起时延、误差和安全性等问题。
[0017]进一步地,还包括步骤:
[0018]S31:初始化的训练集和类别,测试集和训练集并记为测试集样本和训练集样本;
[0019]S32:计算测试集样本与训练集样本的皮尔逊相关系数;
[0020]S33:根据皮尔逊相关系数对训练集样本进行降序排序;
[0021]S34:选取皮尔逊相关系数最大前K个训练样本,统计其在各类别中的频率;
[0022]S35:定义频率最大的类别,既测试集样本属于该类别。
[0023]在本方案中,在KNN算法中K值的选取不同对于分类结果有显著的差别,合适的K值能有效提高算法的准确率,提高配网电气拓扑识别精度。
[0024]进一步地,在步骤S35之后,对测试样本进行判断,若为最后一个测试样本则步骤S3结束,否则返回步骤S32循环。
[0025]在本方案中,已经测试的样本实时添加到训练集形成一种训练集更新机制。训练集更新机制下,随着测试样本不断的加入训练集,分类精度也不断得到提高。
[0026]优选地,在步骤S2中,在进行缺失值均值填充处理过程中,可先对数据集A直接进行均值填充处理后,再划分为训练集B和测试集C。
[0027]本专利技术还提供基于边缘计算改进KNN的配网电气拓扑识别系统,包括:电表单元:用于采集用户的电压数据;台区单元,用于汇总变压器供电范围的多个所述电表单元内的数据,边缘网关单元:用于收集所述台区单元的电压数据并得到所述台区单元的用户所属相别数据;主站:用于汇总各个所述边缘网关单元得到的用户所属相别数据。
[0028]需要说明的是,相比现有技术中,各个电力用户电压数据通过电表

台区

主站,通过主站对传输的数据进行处理并识别各个电路用户的相别,对于主站而言,其采集的数据量过于庞大,无疑增加了主站的数据运算量,通过本方案的改进,各个电力用户电压数据通过电表

台区

边缘网关

主站,边缘网关对应一个台区,边缘网关对相应台区电力用户电压数据进行处理得到台区用户所属相别数据,将用户所属相别数据传输给主站,有效减少了主站运算量,且由于数据量的大幅减少提高主站数据收集的速度,减少了传输过程中产生的时延。
[0029]优选地,所述台区单元对应三个电表单元,所述每个台区单元对应一个所述边缘网关单元,由于我国普遍采用三相交流电源,由三个频率相同、振幅相等、相位依次互差120
°
的交流电势组成,每个相位对应一个电表单元,三个电表单元尽量接入均等的用户,保证电力的利用最大化。
[0030]优选地,三个电表单元分别为A相电表单元、B相电表单元和C相电表单元。
[0031]本专利技术与现有技术相比,具有如下的优点和有益效果:
[0032]1、本专利技术基于边缘计算改进KNN的配网电气拓扑识别方法及系统,减轻了配网电气拓扑识别过程中对主站传输通道的压力;避免了传输过程中引起时延、误差和安全性等
问题;降低了主站的计算存储压力,且改进后的KNN算法克服了现有技术需要聚类中心和数据量较小时准确率低等问题;
[0033]2、本专利技术基于边缘计算改进KNN的配网电气拓扑识别方法及系统,在获取用户电表的电压数据后,对缺失值进行均值填充处理,然后基于KNN分类算法,用皮尔逊相关系数代替欧式距离作为距离衡量标准以提高分类精度,通过将测试过的样本添加到训练集达到实时更新训练集,从而实现台区内用户相位准确识别;
[0034]3、本专利技术基于边缘计算改进KNN的配网电气拓扑识别方法及系统,将测试后的样本实时添加到训练集形成新的训练集。在下一个测试样本进行分类时有更多的训练样本作为参照标准,分类精度也随之提高。训练集更新机制不仅能有效提高整体分类精度且适用于边缘计算下的配网电气拓扑识别。
附图说明
[0035]此处所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于边缘计算改进KNN的配网电气拓扑识别方法,其特征在于,包括以下步骤:S1:获取一个台区单元的各个电表单元用户电压数据并记为数据集A;S2:对所述数据集A划分训练集和测试集,对所述训练集和测试集的缺失值进行均值填充处理,将均值填充处理后的训练集记为训练集B,将均值填充后的测试集记为测试集C;S3:对KNN分类算法做改进,选用皮尔逊相关系数作为数据距离度量标准,取测试集C中的样本与训练集B对比进行分类计算,确定测试集C中该样本所属相别;S4:将测试集C中已确定所属相别的样本添加到训练集B对训练集B做更新,并记为训练集D;S5:重复所述的S3步骤,将测试集C中的下一个样本与所述训练集D对比进行分类计算,最终确定测试集C中下一个样本所属相别;S6:重复所述S4步骤的训练集更新与所述S3步骤的分类计算,直至测试集C中的所有样本全部得到所属相别。2.根据权利要求1所述的基于边缘计算改进KNN的配网电气拓扑识别方法,其特征在于,步骤S3中还包括步骤:S31:初始化的训练集和类别,测试集和训练集并记为测试集样本和训练集样本;S32:计算测试集样本与训练集样本的皮尔逊相关系数;S33:根据皮尔逊相关系数对训练集样本进行降序排序;S34:选取皮尔逊相关系数最大前K个训练样本,统计其在各类...

【专利技术属性】
技术研发人员:刘丽娜周一飞李锐超王韬申杰屈鸣李琪林李方硕李林欢罗银康
申请(专利权)人:国网四川省电力公司电力科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1