一种基于图卷积神经网络的电力业务系统数据对齐方法技术方案

技术编号:37229650 阅读:23 留言:0更新日期:2023-04-20 23:12
本发明专利技术涉及一种基于图卷积神经网络的电力业务系统数据对齐方法,包括:对设备台账信息数据进行清洗、预处理;根据实体及实体间的关系构建知识图谱,获取知识图谱间预对齐的实体对;将知识图谱输入图自注意力卷积神经网络进行训练,将实体对作为对齐种子,作为图自注意力卷积神经网络的监督信息;通过图自注意力卷积神经网络得到各节点的嵌入向量表示,计算知识图谱间各节点的相似性,将最相似的两个节点作为对齐节点;根据对齐节点对待对齐电力业务系统实体的属性数据进行改写。本发明专利技术通过训练好的网络实体对齐模型,关联不同业务系统等价实体,预测多个电力业务系统中指向真实世界中的同一对象的数据的对应情况,保障不同数据源数据的可靠性。源数据的可靠性。源数据的可靠性。

【技术实现步骤摘要】
一种基于图卷积神经网络的电力业务系统数据对齐方法


[0001]本专利技术涉及一种基于图卷积神经网络的电力业务系统数据对齐方法,属于电力业务数据处理


技术介绍

[0002]电力行业的深化改革要求电力企业进一步搞好信息化建设,进而更大程度实现信息互联和资源共享,使电力企业实现对数据资源的有效管理,充分挖掘数据资源的价值,实现降本增益的目标,从而进一步拓展行业空间。
[0003]但是,在运用电力业务系统过程中,不同业务部门对设备信息的记录数据会存在不一致的情况,并且随着时间增长,电力网络数据日益复杂,数据在不同电力业务系统上传播时频繁复制、修改,导致不同业务系统中数据的可靠性降低。这时需要对不同业务系统中表示同一设备的信息进行修改,保证数据的可靠性与一致性。

技术实现思路

[0004]为了克服上述问题,本专利技术提供一种基于图卷积神经网络的电力业务系统数据对齐方法,该方法通过训练好的网络实体对齐模型,关联不同业务系统等价实体,预测多个电力业务系统中指向真实世界中的同一对象的数据的对应情况,保障不同数据源数据的可靠性。本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于图卷积神经网络的电力业务系统数据对齐方法,其特征在于,包括:获取两待对齐电力业务系统的设备台账信息数据,对所述设备台账信息数据进行清洗、预处理;分别获取各电力业务系统中的实体及所述实体间的关系,根据所述实体及所述实体间的关系构建知识图谱,获取两所述知识图谱间预对齐的实体对,其中,所述实体为所述知识图谱的节点,所述实体间的关系为所述知识图谱的边;将所述知识图谱输入图自注意力卷积神经网络进行训练,将所述实体对作为对齐种子,作为所述图自注意力卷积神经网络训练时的监督信息;通过所述图自注意力卷积神经网络得到各所述节点的嵌入向量表示,计算所述知识图谱间各节点的相似性,将最相似的两个节点作为对齐节点;根据对齐节点对待对齐电力业务系统实体的属性数据进行改写。2.根据权利要求1所述基于图卷积神经网络的电力业务系统数据对齐方法,其特征在于,对所述设备台账信息数据进行清洗、预处理,具体为剔除所述设备台账信息数据中损坏的数据,将剩余的数据处理为CSV格式。3.根据权利要求1所述基于图卷积神经网络的电力业务系统数据对齐方法,其特征在于,根据所述实体及所述实体间的关系构建知识图谱,获取两所述知识图谱间预对齐的实体对,具体为:提取知识图谱的节点,具体为将所述设备台账信息数据中用于区分实体的属性作为所述知识图谱的节点,将所述实体的文本信息字段作为所述节点的文本特征;通过语言模型提取所述文本特征的语义信息,得到节点的嵌入向量表示;根据所述实体间的关系构造所述节点的边;得到两待对齐的知识图谱G
k
:G
k
={E
k
,R
k
,T
k
};其中,k=1或2,E
k
、R
k
和T
k
分别为所述知识图谱中节点的集合、实体关系的集合和三元组<e1,r,e2>,e1,e2∈E,r∈R,r为实体e1和实体e2之间的关系;根据所述实体具有唯一值的属性对实体进行预对齐,得到实体对,实体对集合S为:其中,x、y分别为知识图谱G1、G2的实体节点。4.根据权利要求3所述基于图卷积神经网络的电力业务系统数据对齐方法,其特征在于,所述语言模型为LaBSE模型。5.根据权利要求4所述基于图卷积神经网络的电力业务系统数据对齐方法,其特征在于,将所述知识图谱输入图自注意力卷积神经网络进行训练,将所述实体对作为对齐种子,作为所述图自注意力卷积神经网络训练时的监督信息,具体为:S1、将所述实体对集合S以预设比例划分为训练集与验证集,测试集为未对齐的节点;使用单层图注意力卷积神经网络对知识图谱中的各节点的邻居信息进行聚合操作,具体为:S2、随机采样目标节点的20个邻居节点作为邻居集合N
i
,所述邻居节点包含目标节点本身,通过所述邻居集合N
i
中各邻居节点的嵌入向量表示来更新目标节点的嵌入向量表示
聚合公式如下:聚合公式如下:其中,W为可训练权重矩阵,将所述节点的嵌入向量表示映射到高层次的特征,σ均为非线性激活函数Sigmoid,计算方式如下:a
ij
为节点j对节点i的...

【专利技术属性】
技术研发人员:蔡宇翔蒋鑫付婷倪文书王川丰杨启帆
申请(专利权)人:国网福建省电力有限公司信息通信分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1