当前位置: 首页 > 专利查询>湖南大学专利>正文

一种基于邻居节点选择与特征汇聚的实体消歧方法和系统技术方案

技术编号:41581903 阅读:36 留言:0更新日期:2024-06-06 23:57
本发明专利技术公开了一种基于邻居节点选择与特征汇聚的实体消歧方法,其从两个方面提升实体消歧的效果,一方面利用BERT预训练词向量模型对实体本身信息与其属性进行编码,因为属性信息本身是区分实体“一词多义”和“多词同义”直接有效的信息,同时也更好的关注了实体节点本身特征;另一方面,对于利用实体本身信息无法进行消歧的实体,此时利用与待消歧实体有关联的邻居实体信息进行辅助判断,通过邻居节点采样与特征汇聚形成了带邻居实体信息的待消歧节点信息,提升了实体消歧的准确性,同时解决了传统基于深度学习和基于图的实体消歧方法效率不高的问题。

【技术实现步骤摘要】

本专利技术属于人工智能中的深度学习(deep learnrning,简称dl)和自然语言处理(natural language processing,简称nlp),更具体地,涉及一种基于邻居节点选择与特征汇聚的实体消歧方法和系统


技术介绍

1、如今,随着互联网的快速发展和信息数量的爆发式增长,自然语言处理和人工智能(artificial intelligence,简称ai)技术得到了广泛应用。其中,命名实体消歧是自然语言处理过程中的一项关键性研究,在知识图谱等各种应用中发挥着重要的作用。实体消歧技术主要解决命名实体的歧义性和多样性,比如一词多义和多词一义。例如,“七里香”一词既可以指代歌曲《七里香》,也可以是一味中药名,是海桐花科植物台琼海桐的根、叶;而多词一义则表现为“土豆”和“马铃薯”在农业领域中表达的是同一种植物。因此,仅从词语本身,无法确定其真实含义,实体的不准确性在实际使用中严重影响了效率,尤其是在知识图谱中,实体通常只有其名称和属性以及与其他实体相连的关系,若消歧方法准确性不足,知识图谱中知识的准确性就无法保证,从而带来知识的偏差。

<本文档来自技高网...

【技术保护点】

1.一种基于邻居节点选择与特征汇聚的实体消歧方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于邻居节点选择与特征汇聚的实体消歧方法,其特征在于,

3.根据权利要求1或2所述的基于邻居节点选择与特征汇聚的实体消歧方法,其特征在于,步骤(2)包括以下子步骤:

4.根据权利要求1至3中任意一项爱国所述的基于邻居节点选择与特征汇聚的实体消歧方法,其特征在于,

5.根据权利要求4所述的基于邻居节点选择与特征汇聚的实体消歧方法,其特征在于,步骤(5)包括以下子步骤:

6.根据权利要求5所述的基于邻居节点选择与特征汇聚的实体消歧方...

【技术特征摘要】

1.一种基于邻居节点选择与特征汇聚的实体消歧方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于邻居节点选择与特征汇聚的实体消歧方法,其特征在于,

3.根据权利要求1或2所述的基于邻居节点选择与特征汇聚的实体消歧方法,其特征在于,步骤(2)包括以下子步骤:

4.根据权利要求1至3中任意一项爱国所述的基于邻居节点选择与特征汇聚的实体消歧方法,其特征在于,

5.根据权利要求4所述的基于邻居节点选择与特征汇聚的实体消歧方法,其特征在于,步骤(5)包括以下子步骤:

6.根据权利要求5所述的基于邻居节点选择与特征汇聚的实体消歧方法,其特征在于,步骤...

【专利技术属性】
技术研发人员:唐卓李世健张嘉鹏高梓文张博锐王斌朱雅琳
申请(专利权)人:湖南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1