一种基于检索式的问答方法及装置制造方法及图纸

技术编号:37290230 阅读:14 留言:0更新日期:2023-04-21 01:41
本申请公开了一种基于检索式的问答方法及装置,可应用于人工智能技术领域。该方法包括:将问句与问答数据库中的相似问题进行相似度计算;问答数据库包括:标准问题、标准问题的答案以及标准问题对应的相似问题;当问答数据库中存在目标相似问题时,根据问答数据库中目标相似问题对应的标准问题的答案输出问句的答案;目标相似问题为与问句的相似度达到第一预设阈值的相似问题;当问答数据库中不存在目标相似问题时,通过与问句的字符长度对应的答案确定方式确定问句的答案,并将问句的答案输出。如此,通过为不同类型的文本数据给定不同的答案确定方式,提高了问答的及时性及全面性。性。性。

【技术实现步骤摘要】
一种基于检索式的问答方法及装置


[0001]本申请涉及人工智能
,特别是涉及一种基于检索式的问答方法及装置。

技术介绍

[0002]人工智能包括十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作,为了减轻人类的工作量,人工智能得到了愈加广泛的重视。
[0003]检索式问答是指机器人通过检索的方式从知识库中挑选一个最佳答案给用户,从而实现问答。现有的人工智能问答方法具有一定局限性且容易出现匹配失误的情况。
[0004]因此,如何在保证问答准确性的同时提高问答的及时性及全面性,是本领域技术人员急需解决的问题。

技术实现思路

[0005]基于上述问题,本申请提供了一种基于检索式的问答方法及装置,通过为不同类型的文本数据给定不同的答案确定方式,从而在保证问答准确性的同时提高了问答的及时性及全面性。
[0006]第一方面,本申请实施例提供了一种基于检索式的问答方法,包括:
[0007]将问句与问答数据库中的相似问题进行相似度计算;所述问答数据库包括:标准问题、所述标准问题的答案以及所述标准问题对应的所述相似问题;
[0008]当所述问答数据库中存在目标相似问题时,根据所述问答数据库中所述目标相似问题对应的所述标准问题的答案输出所述问句的答案;所述目标相似问题为与所述问句的相似度达到第一预设阈值的相似问题;
[0009]当所述问答数据库中不存在所述目标相似问题时,通过与所述问句的字符长度对应的答案确定方式确定所述问句的答案,并将所述问句的答案输出。
[0010]可选的,所述当所述问答数据库中存在目标相似问题时,根据所述问答数据库中所述目标相似问题对应的所述标准问题的答案输出所述问句的答案,包括:
[0011]当全部目标相似问题对应一个所述标准问题时,将所述标准问题的答案作为所述问句的答案进行输出;
[0012]当全部目标相似问题对应于多个不同的所述标准问题时,根据所述目标相似问题与所述问句的相似度与第二预设阈值的相对大小,从全部目标相似问题中确定出参考相似问题,并根据所述参考相似问题对应的所述标准问题的答案输出所述问句的答案;所述第二预设阈值大于第一预设阈值。
[0013]可选的,所述当全部目标相似问题对应于多个不同的所述标准问题时,根据所述目标相似问题与所述问句的相似度与第二预设阈值的相对大小,从全部目标相似问题中确定出参考相似问题,并根据所述参考相似问题对应的所述标准问题的答案输出所述问句的答案,包括:
[0014]当存在相似度达到第二预设阈值的所述目标相似问题时,将相似度最高的所述目标相似问题对应的所述标准问题的答案作为所述问句的答案进行输出;
[0015]当不存在相似度达到第二预设阈值的所述目标相似问题,且所述目标相似问题对应至少两个所述标准问题时,进一步判断获取的对应同一标准问题且数量占比最高的所述目标相似问题的种类;
[0016]若获取的对应同一标准问题且数量占比最高的所述目标相似问题只存在一类时,将获取的对应同一标准问题且数量占比最高的一类所述目标相似问题对应的所述标准问题的答案作为所述问句的答案进行输出;
[0017]若获取的对应同一标准问题且数量占比最高的所述目标相似问题至少存在两类时,采取加和求平均的方式分别计算不同类所述目标相似问题的相似度平均值,将相似度平均值最高的一类所述目标相似问题对应的所述标准问题的答案作为所述问句的答案进行输出。
[0018]可选的,所述当所述问答数据库中不存在所述目标相似问题时,通过与所述问句的字符长度对应的答案确定方式确定所述问句的答案,并将所述问句的答案输出,包括:
[0019]当所述问答数据库中不存在所述目标相似问题时,判断所述问句的字符长度;
[0020]若所述问句的字符长度未达到第三预设阈值时,根据所述问句反馈所述相似问题供用户选定;
[0021]根据用户选定的所述相似问题确定所述问句的答案,并将所述问句的答案输出;
[0022]若所述问句的字符长度达到第三预设阈值时,利用深度学习模型对所述问句进行意图识别计算;
[0023]根据计算结果确定所述问句的答案,并将所述问句的答案输出。
[0024]可选的,所述若所述问句的字符长度未达到第三预设阈值时,根据所述问句反馈所述相似问题供用户选定,包括:
[0025]若所述问句的字符长度未达到第三预设阈值时,判断所述问答数据库中是否存在完全包含所述问句的所述相似问题;
[0026]根据判断结果选择与所述问句对应的所述相似问题进行反馈,供用户选定。
[0027]可选的,所述根据判断结果选择与所述问句对应的所述相似问题进行反馈,供用户选定,包括:
[0028]当判断结果为是时,选择对应不同所述标准问题的所述相似问题进行反馈,供用户选定;
[0029]当判断结果为否时,对所述问句进行切词处理,生成不同权重的关键词;
[0030]选择包含高权重关键词的对应不同标准问题的所述相似问题进行反馈,供用户选定。
[0031]可选的,所述若所述问句的字符长度达到第三预设阈值时,利用深度学习模型对所述问句进行意图识别计算,包括:
[0032]若所述问句的字符长度达到第三预设阈值时,根据规则意图计算公式,利用分类模型以及关键词进行权重综合打分得到意图值。
[0033]可选的,所述根据计算结果确定所述问句的答案,并将所述问句的答案输出,包括:
[0034]当所述意图值大于或等于预设数值时,根据意图标签确定所述问句的答案,并将所述问句的答案输出。
[0035]可选的,所述将问句与问答数据库中的相似问题进行相似度计算之前,还包括:
[0036]获取问句;
[0037]对所述问句进行敏感词检测,将存在敏感词的所述问句进行滤除;
[0038]将通过敏感词检测,不存在敏感词的所述问句进行转人工判断,将存在转人工需求的所述问句进行滤除,得到符合问答条件的所述问句。
[0039]第二方面,本申请实施例提供了一种基于检索式的问答装置,包括:
[0040]第一获取模块,用于将问句与问答数据库中的相似问题进行相似度计算;
[0041]所述问答数据库包括:标准问题、所述标准问题的答案以及所述标准问题对应的所述相似问题;
[0042]第一确定模块,用于当所述问答数据库中存在目标相似问题时,根据所述问答数据库中所述目标相似问题对应的所述标准问题的答案输出所述问句的答案;
[0043]所述目标相似问题为与所述问句的相似度达到第一预设阈值的相似问题;
[0044]第二确定模块,用于当所述问答数据库中不存在所述目标相似问题时,通过与所述问句的字符长度对应的答案确定方式确定所述问句的答案,并将所述问句的答案输出。
[0045]从以上技术方案可以看出,相较于现有技术,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于检索式的问答方法,其特征在于,所述方法包括:将问句与问答数据库中的相似问题进行相似度计算;所述问答数据库包括:标准问题、所述标准问题的答案以及所述标准问题对应的所述相似问题;当所述问答数据库中存在目标相似问题时,根据所述问答数据库中所述目标相似问题对应的所述标准问题的答案输出所述问句的答案;所述目标相似问题为与所述问句的相似度达到第一预设阈值的相似问题;当所述问答数据库中不存在所述目标相似问题时,通过与所述问句的字符长度对应的答案确定方式确定所述问句的答案,并将所述问句的答案输出。2.根据权利要求1所述的方法,其特征在于,所述当所述问答数据库中存在目标相似问题时,根据所述问答数据库中所述目标相似问题对应的所述标准问题的答案输出所述问句的答案,包括:当全部目标相似问题对应一个所述标准问题时,将所述标准问题的答案作为所述问句的答案进行输出;当全部目标相似问题对应于多个不同的所述标准问题时,根据所述目标相似问题与所述问句的相似度与第二预设阈值的相对大小,从全部目标相似问题中确定出参考相似问题,并根据所述参考相似问题对应的所述标准问题的答案输出所述问句的答案;所述第二预设阈值大于第一预设阈值。3.根据权利要求2所述的方法,其特征在于,所述当全部目标相似问题对应于多个不同的所述标准问题时,根据所述目标相似问题与所述问句的相似度与第二预设阈值的相对大小,从全部目标相似问题中确定出参考相似问题,并根据所述参考相似问题对应的所述标准问题的答案输出所述问句的答案,包括:当存在相似度达到第二预设阈值的所述目标相似问题时,将相似度最高的所述目标相似问题对应的所述标准问题的答案作为所述问句的答案进行输出;当不存在相似度达到第二预设阈值的所述目标相似问题,且所述目标相似问题对应至少两个所述标准问题时,进一步判断获取的对应同一标准问题且数量占比最高的所述目标相似问题的种类;若获取的对应同一标准问题且数量占比最高的所述目标相似问题只存在一类时,将获取的对应同一标准问题且数量占比最高的一类所述目标相似问题对应的所述标准问题的答案作为所述问句的答案进行输出;若获取的对应同一标准问题且数量占比最高的所述目标相似问题至少存在两类时,采取加和求平均的方式分别计算不同类所述目标相似问题的相似度平均值,将相似度平均值最高的一类所述目标相似问题对应的所述标准问题的答案作为所述问句的答案进行输出。4.根据权利要求1所述的方法,其特征在于,所述当所述问答数据库中不存在所述目标相似问题时,通过与所述问句的字符长度对应的答案确定方式确定所述问句的答案,并将所述问句的答案输出,包括:当所述问答数据库中不存在所述目标相似问题时,判断所述问句的字符长...

【专利技术属性】
技术研发人员:李伟光
申请(专利权)人:长城汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1