基于多关系深度检索文本匹配的人名消歧方法技术

技术编号:45048507 阅读:13 留言:0更新日期:2025-04-22 17:34
本发明专利技术提供一种基于多关系深度检索文本匹配的人名消歧方法,涉及人名消歧技术领域,本发明专利技术通过获取企业和人相关的跨模态数据,通过实体对齐算法对跨模态数据进行数据对齐与数据融合,形成人企结构化数据集,通过基于预训练语言模型建立多关系深度检索模型生成语义向量,根据语义向量计算语义相似性,并根据人企结构化数据集计算的共现频率、时空关联性特征生成人物嵌入向量,基于对抗神经网络建立消歧识别模型,根据人物嵌入向量进行人名消歧,通过图注意力网络建立结构更新模型,实时更新图谱结构,根据贝叶斯定理计算语义相似性、共现频率的置信度,根据置信度对语义相似性、共现频率的权重进行更新。

【技术实现步骤摘要】

本专利技术涉及人名消歧,具体为一种基于多关系深度检索文本匹配的人名消歧方法


技术介绍

1、在过去的几十年里,人名消歧旨在消除不同环境下人名的歧义性,主要任务根据人名和其他信息识别出人名对应的真实的人。现有的企业和工商公示数据对于人员往往只涉及到人名,而没有对应人员的身份信息,这使得我们无法准确识别出个人和企业相关关系,从而阻碍了人企关系库的构建,进一步对供应链管理、风险准入排查等商业业务构成了挑战。由于涉及的企业和人员的数量是巨大的,现有的人名消歧方法难以高效地准确地完成人员识别的任务。传统的人名消歧方法大多是基于企业自身信息和企业关联信息的,较少考虑到人员信息,从而不可能识别出同一个公司真实情况下确实有两个同名的不同人的情况,进一步,会产生误识别的问题。

2、现有技术中的,公开号为cn 114611516 a公开了人名消歧方法、装置、存储介质及电子设备,根据获取的企业关系数据生成以企业和自然人为节点的第一关系图;对第一关系图进行拆分得到若干第二关系图;基于若干第二关系图训练预设的图网络模型得到向量表示模型;根据关联节点和向量表示模型或根据获本文档来自技高网...

【技术保护点】

1.一种基于多关系深度检索文本匹配的人名消歧方法,其特征在于,具体步骤包括:

2.根据权利要求1所述的一种基于多关系深度检索文本匹配的人名消歧方法,其特征在于:所述跨模态数据获取的方式分别为:通过企业公示系统、通过社交软件、新闻聚合平台;

3.根据权利要求2所述的一种基于多关系深度检索文本匹配的人名消歧方法,其特征在于:所述通过实体对齐算法对跨模态数据进行数据对齐的计算方法为:其中,为人企名称数据内部数据类型,,,为余弦相似度;

4.根据权利要求3所述的一种基于多关系深度检索文本匹配的人名消歧方法,其特征在于:所述对对齐后的数据进行数据融合的计算公式为...

【技术特征摘要】

1.一种基于多关系深度检索文本匹配的人名消歧方法,其特征在于,具体步骤包括:

2.根据权利要求1所述的一种基于多关系深度检索文本匹配的人名消歧方法,其特征在于:所述跨模态数据获取的方式分别为:通过企业公示系统、通过社交软件、新闻聚合平台;

3.根据权利要求2所述的一种基于多关系深度检索文本匹配的人名消歧方法,其特征在于:所述通过实体对齐算法对跨模态数据进行数据对齐的计算方法为:其中,为人企名称数据内部数据类型,,,为余弦相似度;

4.根据权利要求3所述的一种基于多关系深度检索文本匹配的人名消歧方法,其特征在于:所述对对齐后的数据进行数据融合的计算公式为:其中,为融合后的第个人企初始数据集的人名与企业名称相关数据,分别为文本特征、结构化数据、图像数据和地理信息数据所占权重,。

5.根据权利要求1所述的一种基于多关系深度检索文本匹配的人名消歧方法,其特征在于:所述语义向量生成的具体步骤为:

6.根据权利要求5所述的一种基于多关系深度检索文本匹配的人名...

【专利技术属性】
技术研发人员:陈绪龙韦业超黄红亮刘琦张睿张皓天万旭阳
申请(专利权)人:安徽经邦软件技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1