面向多源异构数据源的智能问答方法及装置制造方法及图纸

技术编号：28837689 阅读：11 留言：0更新日期：2021-06-11 23:35

本发明专利技术提供一种面向多源异构数据源的智能问答方法及装置，方法包括：计算输入问题与候选关系的第一相似度；根据第一相似度，从知识库中获取第一答案；根据输入问题检索多跳文本；计算多跳文本中的句子与输入问题之间的第二相似度以及多跳文本中的实体与输入问题之间的第三相似度；根据第二相似度及第三相似度，从多跳文本中获取第二答案；判定第一答案和第二答案的关系，输出输入问题的答案文本。通过本发明专利技术的面向多源异构数据源的智能问答方法及装置，提升了输出答案的准确度以及丰富性，能够返回一个更易于用户理解、简洁完整的答案。

全部详细技术资料下载

【技术实现步骤摘要】
面向多源异构数据源的智能问答方法及装置
本专利技术涉及深度学习和智能问答
，尤其涉及一种面向多源异构数据源的智能问答方法及装置。
技术介绍
智能问答的实现涉及到知识库问答、信息检索、知识表示等多个技术，已逐步应用于知识获取、聊天机器人等场景中。根据问题答案的来源，可将问答技术分为两个方向，一个是答案来源于结构化信息的知识库问答技术；另一个是答案来源于非结构化信息的文本问答技术。一方面，随着深度学习技术的快速发展，越来越多的研究学者尝试利用深度神经网络对问题和知识库知识进行短文本语义建模，并且通过计算两者之间的相似度去获得最匹配的知识作为问题的答案，这种基于向量建模的知识库问答方法不需要专家知识和人工干预，而且能保证一定的回答准确度，但是现有的向量建模方法仍有一些局限：知识库知识表示不够全面，缺少知识库信息；模型无法辨别字面相近的知识等，限制模型准确度的进一步提升。另一方面，近年来图神经网络在自然语言处理领域取得了重大进展，推动了其在多跳文本问答任务中的发展。现有的基于图神经网络的多跳文本问答方法使用图卷积网络、图循环网络、图注意力网络等图神经网络通过在构建的实体图上进行推理得到文本中最相关的答案线索。但是这些方法只关注了文本中的实体信息；缺少对噪音句子的过滤等，从而降低了模型的推理能力。另外，现有的智能问答技术很少研究利用多源异构信息源将两者结合起来进行优势互补的方法。
技术实现思路
(一)要解决的技术问题针对于现有的技术问题，本专利技术提供一种面向多源异构数...

【技术保护点】
1.一种面向多源异构数据源的智能问答方法，其特征在于，包括：/n计算输入问题与候选关系的第一相似度，其中，所述候选关系为知识库中与所述输入问题相关的关系；/n根据所述第一相似度，从所述知识库中获取第一答案；/n根据所述输入问题检索多跳文本；/n计算所述多跳文本中的句子与所述输入问题之间的第二相似度以及所述多跳文本中的实体与所述输入问题之间的第三相似度；/n根据所述第二相似度及所述第三相似度，从所述多跳文本中获取第二答案；/n判定所述第一答案和所述第二答案的关系，输出所述输入问题的答案文本。/n

【技术特征摘要】
1.一种面向多源异构数据源的智能问答方法，其特征在于，包括：
计算输入问题与候选关系的第一相似度，其中，所述候选关系为知识库中与所述输入问题相关的关系；
根据所述第一相似度，从所述知识库中获取第一答案；
根据所述输入问题检索多跳文本；
计算所述多跳文本中的句子与所述输入问题之间的第二相似度以及所述多跳文本中的实体与所述输入问题之间的第三相似度；
根据所述第二相似度及所述第三相似度，从所述多跳文本中获取第二答案；
判定所述第一答案和所述第二答案的关系，输出所述输入问题的答案文本。

2.根据权利要求1所述的面向多源异构数据源的智能问答方法，其特征在于，查询所述输入问题中的实体在所述知识库中的实体类型；
获取所述知识库的层级信息和所述输入问题与所述候选关系的字面信息；
根据所述实体类型、所述层级信息，以及所述字面信息计算所述输入问题与所述候选关系的第一相似度。

3.根据权利要求2所述的面向多源异构数据源的智能问答方法，其特征在于，所述根据所述知识库的实体类型信息和层级信息，以及所述输入问题与所述候选关系的字面信息计算所述输入问题与所述候选关系的第一相似度，包括：
去除所述输入问题中包含的实体，得到问题模板；
整合所述实体类型的全局信息和局部信息的特征；
计算特征整合后的所述实体类型和所述候选关系的相似度，得到第一相似度得分；
分别对所述问题模板和所述候选关系进行语义匹配和字面匹配，计算所述问题模板和所述候选关系的相似度，得到第二相似度得分和第三相似度得分，其中，所述进行语义匹配，包括：
基于所述知识库的层级信息，将所述候选关系分为分别映射所述实体和所述问题模板中的关系指代两个部分，来计算得到所述第二相似度得分。

4.根据权利要求3所述的面向多源异构数据源的智能问答方法，其特征在于，所述根据所述第一相似度，从知识库中获取第一答案，包括：
根据所述第一相似度得分，所述第二相似度得分和所述第三相似度得分得到与所述输入问题最匹配的所述候选关系，并根据所述与所述输入问题最匹配的所述候选关系对所述输入问题进行实体检测，得到主题实体，再根据所述主题实体得到所述第一答案。

5.根据权利要求1所述的面向多源异构数据源的智能问答方法，其特征在于，
所述计算所述多跳文本中的句子与所述输入问题之间的第二相似度以及所述多跳文本中的实体与所述输入问题之间的第三相似度，包括：
筛选出与所述输入问题相关联的篇章并拼接成长...

【专利技术属性】
技术研发人员：孙显，刘庆，李树超，张泽群，刘康，李晓宇，李欣隆，吕博，
申请(专利权)人：中国科学院空天信息创新研究院，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人