一种基于因果推断消除流行度偏差的知识图谱实体链接方法、系统及介质技术方案

技术编号:46579447 阅读:0 留言:0更新日期:2025-10-10 21:20
本发明专利技术公开了一种基于因果推断消除流行度偏差的知识图谱实体链接方法、系统及介质,实体候选集生成阶段:对输入文本进行处理,生成候选实体集,并提取各候选实体的语义特征、结构特征及流行度特征;有效解决了冷门实体被忽视的问题,复杂语境和噪声数据下的鲁棒性显著增强;验证了方法在平衡流行度与语义相关性上的有效性;使模型更全面地感知实体在知识图谱中的上下文关系,进一步提升实体链接的准确性和鲁棒性。消融实验表明,结构特征的引入对长尾实体性能提升贡献显著。

【技术实现步骤摘要】

本专利技术涉及自然语言处理、知识图谱与人工智能领域,尤其涉及一种基于因果推断消除流行度偏差的知识图谱实体链接方法、系统及介质


技术介绍

1、随着互联网及大数据的发展,知识图谱已成为文本智能理解与信息检索等核心任务的重要支撑技术。实体链接(entitylinking,el)作为知识服务应用中的关键环节,其准确性直接影响下游任务的效果。传统实体链接方法主要依赖文本上下文与知识图谱实体的语义匹配,同时引入实体的流行度特征(如wikipedia引用次数、外部链接数等)来提升链接准确率。

2、然而,实体流行度分布存在显著不均衡性:热门实体因高频曝光易被模型优先选择,而冷门实体即便文本上下文有明确指向也常被忽视。例如,面对“迈克尔乔丹有什么学术成就”时,模型更倾向于链接篮球“迈克尔乔丹”,而非机器学习领域的学者,这种“流行度偏差”导致推荐系统在长尾实体识别上准确率降低,限制了知识图谱应用的广度与深度。

3、近年来,因果推断方法在消除混杂因素、揭示变量真实因果关系方面潜力显著,已在推荐、广告等领域尝试校正偏差,但在知识图谱实体链接任务中的系统化本文档来自技高网...

【技术保护点】

1.一种基于因果推断消除流行度偏差的知识图谱实体链接方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于因果推断消除流行度偏差的知识图谱实体链接方法,其特征在于:所述S1实体候选集生成阶段包括:

3.根据权利要求1所述的基于因果推断消除流行度偏差的知识图谱实体链接方法,其特征在于:所述S2中f(T,Z)为语义匹配子模型,g(Z)为流行度影响函数,α通过网格搜索优化;

4.根据权利要求1所述的基于因果推断消除流行度偏差的知识图谱实体链接方法,其特征在于:

5.根据权利要求1所述的基于因果推断消除流行度偏差的知识图谱实体链接方法,其特...

【技术特征摘要】

1.一种基于因果推断消除流行度偏差的知识图谱实体链接方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于因果推断消除流行度偏差的知识图谱实体链接方法,其特征在于:所述s1实体候选集生成阶段包括:

3.根据权利要求1所述的基于因果推断消除流行度偏差的知识图谱实体链接方法,其特征在于:所述s2中f(t,z)为语义匹配子模型,g(z)为流行度影响函数,α通过网格搜索优化;

4.根据权利要求1所述的基于因果推断消除流行度偏差的知识图谱实体链接方法,其特征在于:

5.根据权利要求1所述的基于因果推断消除流行度偏差的知识图谱实体链接方法,其特征在于:所述图神经网络为gcn或graphsage,聚合函数aggregate采用均值聚合、池化...

【专利技术属性】
技术研发人员:杨渔樵
申请(专利权)人:圆周率人工智能杭州有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1