System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于电力档案数据治理,尤其涉及一种电力档案数据治理方法、系统、设备及介质。
技术介绍
1、本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
2、电力档案包含了丰富的信息和数据,涵盖供电网络、设备、工程施工等多个领域,包括供电网路拓扑、设备台账、施工记录、电力工程规划、电力设备参数等众多方面的档案数据,档案数据往往是电力实体的静态属性信息记录,如站(供电站)-线(输电线路或馈线)-变(变压器)设备台账档案中,档案数据包含变电站信息、线路信息、变压器信息、变电站线路关系信息、线路变压器关系信息、台区信息、台区变压器关系、线路台区关系信息、台区用户关系信息等实体,各实体分别包含静态属性数据,如变压器信息包含变压器设备标识、变压器设备容量、变压器设备地址、变压器生效日期等;线路信息包含线路管线标志、线路公专标识、线路客户标志等;线路台区关系包含管线标识、配送站标识、线站关系类型等;这些属性数据一部分是通过从特定选项中选择录入、一部分是根据规则自动生成、还有一部分是通过手动录入。
3、专利技术人发现,现有的电网量测数据与电力档案的关联,通常是基于电网量测数据所对应量测点与电力档案之间的预设关系直接进行关联,但是,由于电力档案中的部分属性数据需要手动录入,在实际应用中很难避免手动录入错误,同时,还存在计划和最终安装实施不一致等导致的信息录入不匹配问题,如某台区a1、a2主要通过某线路b1进行配电,最终实际线路b1只包含台区a1,而a2通过线路b2进行配电,综上,当前急需一种能够实
技术实现思路
1、为克服上述现有技术的不足,本专利技术提供了一种电力档案数据治理方法、系统、设备及介质,所述方案基于实时电网量测数据及深度学习模型,实现电力档案数据的治理,避免了电网量测数据与电力档案之间早期关联的错误问题。
2、根据本专利技术实施例的第一个方面,提供了一种电力档案数据治理方法,包括:
3、获取待关联的实时电网量测数据及其预先对应的初始电力档案数据;
4、分别对实时电网量测数据和初始电力档案数据进行特征提取,获得量测特征和初始档案特征;
5、以所述量测特征和初始档案特征作为预先训练的深度学习模型的输入,获得量测特征与初始档案特征的关联度得分;
6、根据所述关联度得分与预设阈值的比较结果,获得实时电网量测数据与其预先对应的初始电力档案数据的关联判别结果,并基于关联判别结果进行电力档案数据的治理。
7、进一步的,所述深度学习模型采用双塔模型,所述双塔模型包括用于获取量测数据表征的量测塔、用于获取档案数据表征的档案塔以及用于计算量测数据表征和档案数据表征的相似度函数。
8、进一步的,所述量测塔和档案塔采用的神经网络类型为全连接网络、transform网络、卷积神经网络、循环神经网络或长短时记忆网络。
9、进一步的,所述深度学习模型的训练,具体为:
10、基于历史电网量测数据及其正确对应的电力档案数据,形成量测-档案二元组,基于所述二元组构建训练集的正样本集合;
11、基于正样本集合中任意正样本中的电网量测数据以及正样本集合中非当前正样本中的其它电力档案数据,形成量测-档案二元组,基于所述二元组构建训练集的负样本集合;
12、基于构建的训练集以及预先确定的损失函数,对所述深度学习模型进行训练,获得训练好的深度学习模型。
13、进一步的,所述深度学习模型的训练,以最大化正样本相似度,且最小化负样本相似度为目标进行训练,所述深度学习模型采用如下损失函数:
14、;
15、其中, c表示损失函数,为正样本得分,为负样本得分,为量测数据表征,为与正确关联的档案数据表征,为与错误关联的档案数据表征。
16、进一步的,基于关联判别结果进行电力档案数据的治理,具体为:
17、当关联度得分大于等于预设阈值时,判定实时电网量测数据与其预先对应的初始电力档案数据关联正确,将当前实时电网量测数据录入初始电力档案中即可;
18、当关联度得分小于预设阈值时,判定实时电网量测数据与其预先对应的初始电力档案数据关联错误,此时执行电力档案数据的治理措施。
19、进一步的,所述治理措施可以为:
20、将正确关联的电网量测数据和电力档案数据进行存储,获得正确关联数据集;
21、当判定实时电网量测数据与其预先对应的初始电力档案数据关联错误时,将实时电网量测数据与正确关联数据集中的电网量测数据进行相似度计算,以正确关联数据集中相似度最高的电网量测数据对应的电力档案数据作为实时电网量测数据对应的关联档案。
22、根据本专利技术实施例的第二个方面,提供了一种电力档案数据治理系统,包括:
23、数据获取单元,其用于获取待关联的实时电网量测数据及其预先对应的初始电力档案数据;
24、特征提取单元,其用于分别对实时电网量测数据和初始电力档案数据进行特征提取,获得量测特征和初始档案特征;
25、关联计算单元,其用于以所述量测特征和初始档案特征作为预先训练的深度学习模型的输入,获得量测特征与初始档案特征的关联度得分;
26、数据治理单元,其用于根据所述关联度得分与预设阈值的比较结果,进行实时电网量测数据与其预先对应的初始电力档案数据的关联判别,并基于关联判别结果进行电力档案数据的治理。
27、根据本公开实施例的第三个方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上运行的计算机程序,所述处理器执行所述程序时实现所述的一种电力档案数据治理方法。
28、根据本公开实施例的第四个方面,提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述的一种电力档案数据治理方法。
29、以上一个或多个技术方案存在以下有益效果:
30、(1)本专利技术提供了一种电力档案数据治理方法、系统、设备及介质,所述方案基于实时电网量测数据及深度学习模型,实现电力档案数据的治理,避免了电网量测数据与电力档案之间早期关联的错误问题。
31、(2)本专利技术所述方案基于实时电网量测数据,利用双塔模型训练得到的量测塔模型,和档案塔模型,将量测数据和电力档案数据两种差异较大的数据进行统一,通过计算可比较的相似度距离得分,实现量测数据和档案数据的关联比较来判断档案中关联关系是否存在误差,并通过量测数据之间的互相比较确定该量测数据的真正档案归属,可以快速实现电力档案数据治理,避免手工录入带来的档案数据误差。
32、(3)基于预先充分利用双塔模型线上快速召回排序的推理效果,基于本专利技术双塔模型的设计,可预先基于训练好的档案塔对所有档案进行特征提取,以构建档案数据表征集合,当具体执行本专利技术所述方案时,可仅计算实时本文档来自技高网...
【技术保护点】
1.一种电力档案数据治理方法,其特征在于,包括:
2.如权利要求1所述的一种电力档案数据治理方法,其特征在于,所述深度学习模型采用双塔模型,所述双塔模型包括用于获取量测数据表征的量测塔、用于获取档案数据表征的档案塔以及用于计算量测数据表征和档案数据表征的相似度函数。
3.如权利要求2所述的一种电力档案数据治理方法,其特征在于,所述量测塔和档案塔采用的神经网络类型为全连接网络、transform网络、卷积神经网络、循环神经网络或长短时记忆网络。
4.如权利要求1所述的一种电力档案数据治理方法,其特征在于,所述深度学习模型的训练,具体为:
5.如权利要求1所述的一种电力档案数据治理方法,其特征在于,所述深度学习模型的训练,以最大化正样本相似度,且最小化负样本相似度为目标进行训练,所述深度学习模型采用如下损失函数:
6.如权利要求1所述的一种电力档案数据治理方法,其特征在于,基于关联判别结果进行电力档案数据的治理,具体为:
7.如权利要求6所述的一种电力档案数据治理方法,其特征在于,所述治理措施具体为:
9.一种电子设备,包括存储器、处理器及存储在存储器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7任一项所述的一种电力档案数据治理方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一项所述的一种电力档案数据治理方法。
...【技术特征摘要】
1.一种电力档案数据治理方法,其特征在于,包括:
2.如权利要求1所述的一种电力档案数据治理方法,其特征在于,所述深度学习模型采用双塔模型,所述双塔模型包括用于获取量测数据表征的量测塔、用于获取档案数据表征的档案塔以及用于计算量测数据表征和档案数据表征的相似度函数。
3.如权利要求2所述的一种电力档案数据治理方法,其特征在于,所述量测塔和档案塔采用的神经网络类型为全连接网络、transform网络、卷积神经网络、循环神经网络或长短时记忆网络。
4.如权利要求1所述的一种电力档案数据治理方法,其特征在于,所述深度学习模型的训练,具体为:
5.如权利要求1所述的一种电力档案数据治理方法,其特征在于,所述深度学习模型的训练,以最大化正样本相似...
【专利技术属性】
技术研发人员:孙岗,赵鹏,严莉,曲延盛,常英贤,呼海林,邵志敏,王高洲,杨坤,樊静雨,胡恒瑞,梁天,王中龙,朱尤祥,肖沈阳,王雨晨,张金国,
申请(专利权)人:国网山东省电力公司信息通信公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。