融合多社交媒体平台的知识图谱邻域结构非同构的实体对齐方法技术

技术编号：35817274 阅读：14 留言：0更新日期：2022-12-03 13:41

本发明专利技术涉及一种融合多社交媒体平台的知识图谱邻域结构非同构的实体对齐方法，包括：采集并融合多社交媒体平台的数据，根据用户的交互行为以及主题内容构建知识图谱；计算实体间的注意力权重，得到对中心实体贡献更大的邻居实体；通过拓扑不变函数分别对实体的单跳和两跳邻居进行聚合，补充实体的单跳和两跳邻居表示信息；利用门控机制结合单跳和两跳邻居表示，得到实体表示；根据对齐模块计算实体间的相似度，获得实体对齐的结果。本发明专利技术利用邻域结构非同构的实体对齐模型减弱非同构实体在图结构转换和传统图卷积网络转换中的特征损失，解决了实体非同构性所带来的问题，使得实体对齐的结果更加精准。体对齐的结果更加精准。体对齐的结果更加精准。

全部详细技术资料下载

【技术实现步骤摘要】
融合多社交媒体平台的知识图谱邻域结构非同构的实体对齐方法

[0001]本专利技术涉及机器学习领域，尤其涉及融合多社交媒体平台数据的知识图谱邻域结构非同构的实体对齐方法。

技术介绍

[0002]随着在线社交媒体近年来越来越流行，用户在各媒体平台上的历史用户数据包含了多种不同时间、地点、人物、事件、内容等信息，构成表示为多维度异构网络的知识图谱。用户可能会利用不同的社交媒体平台区分不同的需求，所以同一个用户可能在多个不同的社交媒体平台上产生不同的信息记录。例如，某用户可以使用脸书与其朋友分享近日生活趣事和心情，使用推特了解最新的新闻和时事。然而，同一用户在不同社交媒体平台上拥有的账户以及发表的言论大多数是孤立的，相互之间没有关联。
[0003]判断不同社交媒体平台构建的知识图谱中的用户实体是否指向真实世界同一用户的过程称为用户实体对齐，将不同社交媒体平台构建的知识图谱中的用户实体对齐对于实际生活中的许多跨平台应用具有很大的价值。例如，在将脸书和推特的用户实体进行对齐后，可以利用某一用户在脸书上对应的用户实体的个人兴趣以及社交关系等进行针对性地分析，然后利用分析结果向该用户的推特推送该用户可能会感兴趣的新话题或可能会关注的新朋友。
[0004]现行的用户实体对齐解决方案主要依赖于知识图谱的图结构，基于多平台社交媒体数据知识图谱实体具有邻域同构特性的假设。在从大规模知识图谱中提取的一些合成数据集上这些方法取得了一流的性能，然而合成数据集是由现实数据集提取和整理后产生的，目前的对齐算法在实际结构多样的数据集上不...

【技术保护点】

【技术特征摘要】
1.一种融合多社交媒体平台的知识图谱邻域结构非同构情况实体对齐方法，其特征在于步骤如下：S1、根据用户实体在多个社交媒体平台上的交互以及交互主题内容构建知识图谱；S2、计算实体间的注意力权重，标记对中心实体贡献更大的邻居实体；S3、通过拓扑不变函数分别对实体的单跳和两跳邻居进行聚合，补充实体的单跳和两跳邻居表示信息；S4、利用门控机制结合单跳和两跳邻居表示，得到实体表示；S5、根据对齐模块计算处理后的实体表示，得到实体间相似度，获得对齐的最终结果。2.根据权利要求1所述融合多社交媒体平台的知识图谱邻域结构非同构情况实体对齐方法，其特征在于：所述S1所构建的知识图谱中，所述用户、评论主题均作为其实体节点，用户与用户、用户与评论主题以三元组<h,r,t>的方式构成知识图谱。3.根据权利要求2所述融合多社交媒体平台的知识图谱邻域结构非同构情况实体对齐方法，其特征在于：所述S2中，计算实体间的注意力权重方法具体为：S21：根据知识图谱，引入图注意力网络；S22：针对中心实体和两跳及以上邻居节点应用图注意力网络；S23：使用矩阵和分别对中心实体以及邻居实体进行线性变换，得出实体的注意力权重；S24：使用softmax函数归一化标注实体邻居节点的注意力权重。4.根据权利要求3所述融合多社交媒体平台的知识图谱邻域结构非同构情况实体对齐方法，其特征在于：所述S3中，通过拓扑不变函数对知识图谱进行实体嵌入为：S31：根据知识图谱和S2处理后的实体表示，提取实体的特征矩阵S32：将特征矩阵输入...

【专利技术属性】
技术研发人员：王柱，陈雅宣，刘慧，梁桐嘉，何私琦，郭斌，於志文，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人