【技术实现步骤摘要】
本专利技术涉及自然语言处理、知识图谱与人工智能领域,尤其涉及一种基于因果推断消除流行度偏差的知识图谱实体链接方法、系统及介质。
技术介绍
1、随着互联网及大数据的发展,知识图谱已成为文本智能理解与信息检索等核心任务的重要支撑技术。实体链接(entitylinking,el)作为知识服务应用中的关键环节,其准确性直接影响下游任务的效果。传统实体链接方法主要依赖文本上下文与知识图谱实体的语义匹配,同时引入实体的流行度特征(如wikipedia引用次数、外部链接数等)来提升链接准确率。
2、然而,实体流行度分布存在显著不均衡性:热门实体因高频曝光易被模型优先选择,而冷门实体即便文本上下文有明确指向也常被忽视。例如,面对“迈克尔乔丹有什么学术成就”时,模型更倾向于链接篮球“迈克尔乔丹”,而非机器学习领域的学者,这种“流行度偏差”导致推荐系统在长尾实体识别上准确率降低,限制了知识图谱应用的广度与深度。
3、近年来,因果推断方法在消除混杂因素、揭示变量真实因果关系方面潜力显著,已在推荐、广告等领域尝试校正偏差,但在知识图谱实
...【技术保护点】
1.一种基于因果推断消除流行度偏差的知识图谱实体链接方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于因果推断消除流行度偏差的知识图谱实体链接方法,其特征在于:所述S1实体候选集生成阶段包括:
3.根据权利要求1所述的基于因果推断消除流行度偏差的知识图谱实体链接方法,其特征在于:所述S2中f(T,Z)为语义匹配子模型,g(Z)为流行度影响函数,α通过网格搜索优化;
4.根据权利要求1所述的基于因果推断消除流行度偏差的知识图谱实体链接方法,其特征在于:
5.根据权利要求1所述的基于因果推断消除流行度偏差的知识图
...【技术特征摘要】
1.一种基于因果推断消除流行度偏差的知识图谱实体链接方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于因果推断消除流行度偏差的知识图谱实体链接方法,其特征在于:所述s1实体候选集生成阶段包括:
3.根据权利要求1所述的基于因果推断消除流行度偏差的知识图谱实体链接方法,其特征在于:所述s2中f(t,z)为语义匹配子模型,g(z)为流行度影响函数,α通过网格搜索优化;
4.根据权利要求1所述的基于因果推断消除流行度偏差的知识图谱实体链接方法,其特征在于:
5.根据权利要求1所述的基于因果推断消除流行度偏差的知识图谱实体链接方法,其特征在于:所述图神经网络为gcn或graphsage,聚合函数aggregate采用均值聚合、池化...
【专利技术属性】
技术研发人员:杨渔樵,
申请(专利权)人:圆周率人工智能杭州有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。