【技术实现步骤摘要】
问题文本的答案查找方法、装置、计算机设备和存储介质
[0001]本申请涉及计算机
,特别是涉及一种问题文本的答案查找方法、装置、计算机设备和存储介质。
技术介绍
[0002]随着计算机技术的发展,出现了人工智能技术,人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。而自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。而通过自然语言处理可以实现有效地实现专业领域内的人机问答。
[0003]而目前人机问答一般是基于问答库进行检索式问答,通过问题之间的相似度计算去预先积累的问答库中取到相似答案。然而单纯依靠历史问答数据来实现人机问答无法保证答案的准确性,从而影响人机问答的效果。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种能够有效提高人机问答准确率的问题文本的答案查找方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种问题文本的答案查找方法。所述方法包括:
[0006]对问题文本进行药品实体抽取处理,得到药品实体抽取结果,并对所述问题文本进行意图识别处理,得到意图识别结果;
[0007]通过多路召回排序对所述药品实体抽取结果进行实体标准化处理,得到实体标准化结果;
[0008]基于所述意图识别结果确定所述问题文本中的实体关系; ...
【技术保护点】
【技术特征摘要】
1.一种问题文本的答案查找方法,其特征在于,所述方法包括:对问题文本进行药品实体抽取处理,得到药品实体抽取结果,并对所述问题文本进行意图识别处理,得到意图识别结果;通过多路召回排序对所述药品实体抽取结果进行实体标准化处理,得到实体标准化结果;基于所述意图识别结果确定所述问题文本中的实体关系;基于所述实体标准化结果以及所述实体关系,在标准化药品知识库中关联查找所述问题文本对应的答案文本。2.根据权利要求1所述的方法,其特征在于,所述对问题文本进行药品实体抽取处理,得到药品实体抽取结果,并对所述问题文本进行意图识别处理,得到意图识别结果包括:通过特殊字字典识别所述问题文本中的特殊字;在所述问题文本前插入特殊字;对插入特殊字的问题文本进行编码处理,得到所述问题文本的嵌入特征向量;基于插入特殊字的问题文本中每个字的嵌入特征向量对所述问题文本进行药品实体抽取处理,得到药品实体抽取结果;基于插入特殊字的问题文本的嵌入特征向量对所述问题文本进行意图识别处理,得到意图识别结果。3.根据权利要求2所述的方法,其特征在于,所述对包含特殊字的问题文本进行编码处理,得到所述问题文本的嵌入特征向量包括:对包含特殊字的问题文本进行编码处理,得到所述问题文本中每个字、每个词以及每个二元词的嵌入特征向量。4.根据权利要求3所述的方法,其特征在于,所述基于包含特殊字的问题文本中每个字的嵌入特征向量对所述问题文本进行药品实体抽取处理,得到药品实体抽取结果包括:对所述问题文本的嵌入特征向量进行基于转换器的特征编码处理,得到所述包含特殊字的问题文本中每个字的编码输出向量;对所述编码输出向量进行基于BIO的序列标注处理,得到药品实体抽取结果。5.根据权利要求1所述的方法,其特征在于,所述通过多路召回排序对所述药品实体抽取结果进行实体标准化处理,得到实体标准化结果包括:识别所述药品实体抽取结果中的目标实体;对所述目标实体进行各通路中的命名实体召回处理,得到各通路的召回结果;对所述各通路的召回结果进行排序处理,得到实体排序结果;将所述实体排序结果中最靠前的实体作为实体标准化结果。6.根据权利要求5所述的方法,其特征在于,所述对所述目标实体进行各通路下的命名实体召回处理,得到各通路的召回结果包括:将所述目标实体与各通路下的每个标准实体进行对比,得到所述目标实体与每个标准实体之间的字符距离、拼音距离以及语义距离;基于所述目标实体与每个标准实体之间的字符距离、拼音距离以及语义距离,确定每个标准实体对应的相似度信息;对各通道下每个标准实体对应的相似度信息进行排序,得到各通道的相似度排序结
果;基于各通道的相似度排序结果得到各通路的召回结果。7.根据权利要求6所述的方法,其特征在于,所述基于所述目标实体与每个标准实体之间的字符距离、拼音距离以及语义距离,确定每个标准实体对应的相似度信息包括:通过文本相似度确定所述目标实体与每个标准实体之间的字符距离和拼音距离;通过词向量确定所述目标实...
【专利技术属性】
技术研发人员:杨奕凡,吴贤,郑冶枫,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。