实体链接的构建方法、装置、电子设备和可读存储介质制造方法及图纸

技术编号:37400883 阅读:27 留言:0更新日期:2023-04-30 09:28
本发明专利技术实施例提供了一种实体链接的构建方法、装置和可读存储介质,所述方法包括:获取自然语言问题文本;对所述自然语言问题文本进行实体分析,得到所述自然语言问题文本中的实体信息;基于所述实体信息,计算所述自然语言问题文本中的实体与知识库中实体的相似度,得到所述自然语言问题的候选链接结果;基于所述实体的依存关系信息,对所述候选链接结果进行筛选,得到最终的实体链接。在实体链接过程中结合了文本中实体命名实体信息与依存关系信息,增强了文本中实体与上下文的联系,有效提高了实体链接的准确率,解决了实体链接的准确率低和误召回率高的问题,提高了知识图谱问答的准确率。的准确率。的准确率。

【技术实现步骤摘要】
实体链接的构建方法、装置、电子设备和可读存储介质


[0001]本专利技术涉及自然语言处理
,尤其涉及一种实体链接的构建方法、装置电子设备和可读存储介质。

技术介绍

[0002]近年来,随着知识图谱的发展,利用给定的知识图谱数据自动得出人类自然语言问题的答案成为了时下的研究热点。
[0003]在现有的知识图谱问答中,一般通过直接识别问题文本中的实体,然后与知识库中的实体进行匹配,根据相似度建立实体之间的链接。
[0004]然而上述仅通过匹配实体间的相似度建立链接的方法,经常会出现多余的答案或偏差较大的答案,实体链接的误召回率较高,导致知识图谱问答的准确率较低。

技术实现思路

[0005]本专利技术实施例提供一种实体链接的构建方法、装置、电子设备和可读存储介质,可以解决实体链接的误召回率较高的问题。
[0006]第一方面,本专利技术实施例提供了一种实体链接的构建方法,所述方法包括:
[0007]获取自然语言问题文本;
[0008]对所述自然语言问题文本进行实体分析,得到所述自然语言问题文本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种实体链接的构建方法,其特征在于,包括:获取自然语言问题文本;对所述自然语言问题文本进行实体分析,得到所述自然语言问题文本中的实体信息;所述实体信息包括实体的命名信息和实体的依存关系信息;基于所述实体信息,计算所述自然语言问题文本中的实体与知识库中实体的相似度,得到所述自然语言问题的候选链接结果;基于所述实体的依存关系信息,对所述候选链接结果进行筛选,得到最终的实体链接。2.根据权利要求1所述的方法,所述对所述自然语言问题文本进行实体分析,得到所述自然语言问题文本中的实体信息,包括:利用基于BERT

CRF的命名实体模型对所述自然语言问题文本进行命名实体识别,得到所述自然语言问题文本中的实体的命名信息;利用基于BiLSTM的句法分析模型对所述命名信息进行依存分析,得到自然语言问题文本中的实体的依存关系信息。3.根据权利要求2所述的方法,其特征在于,在步骤利用基于BERT

CRF的命名实体模型对所述自然语言问题文本进行命名实体识别,得到所述自然语言问题文本中的实体的命名信息之前,还包括:获取命名实体模型的原始文本数据集;对所述原始文本数据集中的字符进行标注,得到标注文本数据集;所述标注的类别包括开始字符、中间字符和无关字符;将所述标注文本数据集按比例划分为训练集、测试集和验证集;基于所述训练集、测试集和验证集搭建所述命名实体模型。4.根据权利要求1所述的方法,其特征在于,所述相似度包括所述自然语言问题文本中与知识库中数值类实体的相似度、所述自然语言问题文本中与知识库中非数值类实体的相似度。5.根据权利要求4所述的方法,其特征在于,当计算所述自然语言问题文本中与知识库中数值类实体的相似度时,所述基于所述实体信息,计算所述自然语言问题文本中的实体与知识库中实体的相似度,得到所述自然语言问题的候选链...

【专利技术属性】
技术研发人员:杨春阳邢启洲李健陈明武卫东
申请(专利权)人:北京捷通华声科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1