一种自适应融合时间信息的自动降噪与增强实体对齐方法技术

技术编号：38340556 阅读：15 留言：0更新日期：2023-08-02 09:21

本发明专利技术属于自然语言处理与机器学习领域，具体涉及一种自适应融合时间信息的自动降噪与增强实体对齐方法。该方法包括：编码计算时间关系图注意力网络的输出特征、关系的聚合特征、和时间的聚合特征；计算模型损失；计算相对错误率；对噪声进行过滤并对噪声过滤阈值进行约束；训练模型直至收敛；计算实体对齐的多维度相似性度度量；以及使用训练好的模型用多维度相似性度量算法对实体进行对齐。本发明专利技术有效的解决了实体的时间属性多样性问题，并恰当地建模了时间知识图谱的实体之间的复杂关系，实现了实体时间对齐。除此之外，本发明专利技术自适应地融合时间信息和增加相似性度量的维度，有效抵抗噪声标签对时间实体对齐模型的干扰。抗噪声标签对时间实体对齐模型的干扰。抗噪声标签对时间实体对齐模型的干扰。

全部详细技术资料下载

【技术实现步骤摘要】
一种自适应融合时间信息的自动降噪与增强实体对齐方法

[0001]本专利技术涉及一种自适应融合时间信息的自动降噪与增强实体对齐方法，属于自然语言处理与机器学习领域。

技术介绍

[0002]实体对齐（Entity Alignment），也叫实体匹配（Entity Matching），是指从两个知识图中识别引用同一对象的实体，这对于不完整性很常见的现实世界知识图谱至关重要。知识图谱所承载的丰富信息使其有利于各种应用，例如问答和推荐系统。不幸的是，单一的知识图谱并不能保证知识的全面覆盖。例如，在著名的公共知识数据库Freebase中，超过70%个实体的出生地不明。这种数据稀缺问题极大地限制了知识图谱对下游应用的有效性，知识图谱中信息缺失这一问题可以通过融合两个包含补充信息的知识图谱来加以缓解，而知识图谱融合的一个重要步骤是实体对齐。
[0003]得益于机器学习和深度神经网络的蓬勃发展，许多实体对齐方法通过知识图谱嵌入进行有效的知识图谱融合。尽管他们取得了成功，但实体对齐方法的一个主要限制是他们难以学习事实（实体）的时间动态，因为他们假设事实是静态的；然而，许多事实会随着时间的改变而改变。例如，事实（FIFA 世界杯，主办国，卡塔尔）在2022年起才成立，忽略此类时间信息可能会导致实体歧义和误解，更不用说事实的时间动态还带有可以帮助实体对齐的潜在因果模式。
[0004]在最近的几项研究中，实体对齐任务已经开始包含时间信息（即时间知识图的实体对齐）。一些研究侧重于如何同时学习关系嵌入和时间嵌入。动态网络嵌入的相关...

【技术保护点】

【技术特征摘要】
1.一种自适应融合时间信息的自动降噪与增强实体对齐方法，其特征在于：所述方法包括如下步骤：步骤1、编码计算相关特征：，其中，是时间关系图注意力网络的输出特征，是关系的聚合特征，是时间的聚合特征，是实体的聚合特征，、表示实体集，和分别表示从到的关系和时间链接集，表示关系正交变换矩阵，表示时间正交变换矩阵，并且：，其中，和是共享关系和时间注意力权重向量；步骤2、计算模型的损失，1）用距离L2作为度量来定义两个实体和的表示差异如下：，2）计算测量值和真实值，任何不在种子中的实体都应该被认为是未知实体：，3）计算相对错误率：，其中是绝对误差损失最小化(AELM)，是返回缩减张量的函数，是任何不在种子中的实体 one
‑
hot 矩阵；步骤3：过滤噪声，过滤噪声使用噪声过滤层，所述噪声过滤层是实体嵌入的约束
Moore
‑
Penrose伪逆矩阵变换，其中是所有实体嵌入的集合，、、是SVD分解...

【专利技术属性】
技术研发人员：宋丹丹，李佳，
申请(专利权)人：北京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人