问题文本的答案查找方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:39280263 阅读:6 留言:0更新日期:2023-11-07 10:54
本申请涉及一种问题文本的答案查找方法、装置、计算机设备、存储介质和计算机程序产品。涉及人工智能的自然语言处理领域,方法通过对问题文本进行药品实体抽取处理,得到药品实体抽取结果,并对问题文本进行意图识别处理,得到意图识别结果;通过多路召回排序对药品实体抽取结果进行实体标准化处理,得到实体标准化结果;基于意图识别结果确定问题文本中的实体关系;在标准化药品知识库中关联查找问题文本对应的答案文本。本申请通过实体识别来理解问题文本,得到实体关系。并借助实体抽取与实体标准化的处理得到的实体标准化结果来从标准化药品知识库中查找知识节点,再结合实体关系来从知识节点得到问题文本对应的答案文本,从而有效保证答案文本的准确性。而有效保证答案文本的准确性。而有效保证答案文本的准确性。

【技术实现步骤摘要】
问题文本的答案查找方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机
,特别是涉及一种问题文本的答案查找方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着计算机技术的发展,出现了人工智能技术,人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。而自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。而通过自然语言处理可以实现有效地实现专业领域内的人机问答。
[0003]而目前人机问答一般是基于问答库进行检索式问答,通过问题之间的相似度计算去预先积累的问答库中取到相似答案。然而单纯依靠历史问答数据来实现人机问答无法保证答案的准确性,从而影响人机问答的效果。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够有效提高人机问答准确率的问题文本的答案查找方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种问题文本的答案查找方法。所述方法包括:
[0006]对问题文本进行药品实体抽取处理,得到药品实体抽取结果,并对所述问题文本进行意图识别处理,得到意图识别结果;
[0007]通过多路召回排序对所述药品实体抽取结果进行实体标准化处理,得到实体标准化结果;
[0008]基于所述意图识别结果确定所述问题文本中的实体关系;
[0009]基于所述实体标准化结果以及所述实体关系,在标准化药品知识库中关联查找所述问题文本对应的答案文本。
[0010]第二方面,本申请还提供了一种问题文本的答案查找装置。所述装置包括:
[0011]文本处理模块,用于对问题文本进行药品实体抽取处理,得到药品实体抽取结果,并对所述问题文本进行意图识别处理,得到意图识别结果;
[0012]标准化处理模块,用于通过多路召回排序对所述药品实体抽取结果进行实体标准化处理,得到实体标准化结果;
[0013]实体关系识别模块,用于基于所述意图识别结果确定所述问题文本中的实体关系;
[0014]答案文本查找模块,用于基于所述实体标准化结果以及所述实体关系,在标准化药品知识库中关联查找所述问题文本对应的答案文本。
[0015]第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0016]对问题文本进行药品实体抽取处理,得到药品实体抽取结果,并对所述问题文本进行意图识别处理,得到意图识别结果;
[0017]通过多路召回排序对所述药品实体抽取结果进行实体标准化处理,得到实体标准化结果;
[0018]基于所述意图识别结果确定所述问题文本中的实体关系;
[0019]基于所述实体标准化结果以及所述实体关系,在标准化药品知识库中关联查找所述问题文本对应的答案文本。
[0020]第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0021]对问题文本进行药品实体抽取处理,得到药品实体抽取结果,并对所述问题文本进行意图识别处理,得到意图识别结果;
[0022]通过多路召回排序对所述药品实体抽取结果进行实体标准化处理,得到实体标准化结果;
[0023]基于所述意图识别结果确定所述问题文本中的实体关系;
[0024]基于所述实体标准化结果以及所述实体关系,在标准化药品知识库中关联查找所述问题文本对应的答案文本。
[0025]第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
[0026]对问题文本进行药品实体抽取处理,得到药品实体抽取结果,并对所述问题文本进行意图识别处理,得到意图识别结果;
[0027]通过多路召回排序对所述药品实体抽取结果进行实体标准化处理,得到实体标准化结果;
[0028]基于所述意图识别结果确定所述问题文本中的实体关系;
[0029]基于所述实体标准化结果以及所述实体关系,在标准化药品知识库中关联查找所述问题文本对应的答案文本。
[0030]上述问题文本的答案查找方法、装置、计算机设备、存储介质和计算机程序产品,通过先对问题文本进行药品实体抽取处理,得到药品实体抽取结果,并对问题文本进行意图识别处理,得到意图识别结果。即先通过对问题文本的实体抽取以及意图识别,通过实体抽取确定问题文本涉及的对象,而通过意图识别可以确定问题文本所咨询问题的意图,而后通过多路召回排序对药品实体抽取结果进行实体标准化处理,得到实体标准化结果,通过多路召回的实体标准化将问题文本涉及到的对象通过标准化映射到标准化药品知识库中节点中,并进一步的基于意图识别结果确定问题文本中所涉及的实体关系;从而在标准化药品知识库中通过实体与实体关系来进行关联查找,进而确定问题文本对应的答案文本。本申请通过实体识别来理解问题文本,得到实体关系。并借助实体抽取与实体标准化的处理得到的实体标准化结果来从标准化药品知识库中查找到包含答案文本的知识节点,再结合识别出的实体关系即可从知识节点得到问题文本对应的药品相关答案文本,从而有效保证答案文本的准确性。
附图说明
[0031]图1为一个实施例中问题文本的答案查找方法的应用环境图;
[0032]图2为一个实施例中问题文本的答案查找方法的流程示意图;
[0033]图3为一个实施例中双塔模型的简易结构示意图;
[0034]图4为一个实施例中多通路召回的流程示意图;
[0035]图5为一个实施例中通过知识库进行药品相关的答案文本查找的结构示意图;
[0036]图6为一个实施例中问答界面的示意图;
[0037]图7为一个实施例中实现问题文本的答案查找的框架示意图;
[0038]图8为另一个实施例中问题文本的答案查找方法的流程示意图;
[0039]图9为一个实施例中问题文本的答案查找装置的结构框图;
[0040]图10为一个实施例中计算机设备的内部结构图。
具体实施方式
[0041]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0042]本申请具体涉及人工智能技术,人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问题文本的答案查找方法,其特征在于,所述方法包括:对问题文本进行药品实体抽取处理,得到药品实体抽取结果,并对所述问题文本进行意图识别处理,得到意图识别结果;通过多路召回排序对所述药品实体抽取结果进行实体标准化处理,得到实体标准化结果;基于所述意图识别结果确定所述问题文本中的实体关系;基于所述实体标准化结果以及所述实体关系,在标准化药品知识库中关联查找所述问题文本对应的答案文本。2.根据权利要求1所述的方法,其特征在于,所述对问题文本进行药品实体抽取处理,得到药品实体抽取结果,并对所述问题文本进行意图识别处理,得到意图识别结果包括:通过特殊字字典识别所述问题文本中的特殊字;在所述问题文本前插入特殊字;对插入特殊字的问题文本进行编码处理,得到所述问题文本的嵌入特征向量;基于插入特殊字的问题文本中每个字的嵌入特征向量对所述问题文本进行药品实体抽取处理,得到药品实体抽取结果;基于插入特殊字的问题文本的嵌入特征向量对所述问题文本进行意图识别处理,得到意图识别结果。3.根据权利要求2所述的方法,其特征在于,所述对包含特殊字的问题文本进行编码处理,得到所述问题文本的嵌入特征向量包括:对包含特殊字的问题文本进行编码处理,得到所述问题文本中每个字、每个词以及每个二元词的嵌入特征向量。4.根据权利要求3所述的方法,其特征在于,所述基于包含特殊字的问题文本中每个字的嵌入特征向量对所述问题文本进行药品实体抽取处理,得到药品实体抽取结果包括:对所述问题文本的嵌入特征向量进行基于转换器的特征编码处理,得到所述包含特殊字的问题文本中每个字的编码输出向量;对所述编码输出向量进行基于BIO的序列标注处理,得到药品实体抽取结果。5.根据权利要求1所述的方法,其特征在于,所述通过多路召回排序对所述药品实体抽取结果进行实体标准化处理,得到实体标准化结果包括:识别所述药品实体抽取结果中的目标实体;对所述目标实体进行各通路中的命名实体召回处理,得到各通路的召回结果;对所述各通路的召回结果进行排序处理,得到实体排序结果;将所述实体排序结果中最靠前的实体作为实体标准化结果。6.根据权利要求5所述的方法,其特征在于,所述对所述目标实体进行各通路下的命名实体召回处理,得到各通路的召回结果包括:将所述目标实体与各通路下的每个标准实体进行对比,得到所述目标实体与每个标准实体之间的字符距离、拼音距离以及语义距离;基于所述目标实体与每个标准实体之间的字符距离、拼音距离以及语义距离,确定每个标准实体对应的相似度信息;对各通道下每个标准实体对应的相似度信息进行排序,得到各通道的相似度排序结
果;基于各通道的相似度排序结果得到各通路的召回结果。7.根据权利要求6所述的方法,其特征在于,所述基于所述目标实体与每个标准实体之间的字符距离、拼音距离以及语义距离,确定每个标准实体对应的相似度信息包括:通过文本相似度确定所述目标实体与每个标准实体之间的字符距离和拼音距离;通过词向量确定所述目标实...

【专利技术属性】
技术研发人员:杨奕凡吴贤郑冶枫
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1