一种适用于多场景的智能问答方法、装置及存储介质制造方法及图纸

技术编号:37057096 阅读:5 留言:0更新日期:2023-03-29 19:33
本申请公开了一种适用于多场景的智能问答方法、装置及存储介质,其中该方法,包括:建构意图语料库、知识问答语料库和闲聊语料库;基于所述意图语料库,对用户问句进行意图分类,确定所述用户问句包含的所有意图类别以及各个意图类别的置信度的预测结果;在根据所述预测结果判定所述用户问句包含的所有意图类别的置信度均不大于预设的一级置信度阈值的情况下,基于所述意图语料库、所述知识问答语料库和所述闲聊语料库,对所述用户问句进行文本匹配,确定与所述用户问句相匹配的所有文本数据以及各个文本数据对应的相似度;根据所述各个文本数据对应的相似度、预设的相似度阈值以及二级置信度阈值,确定所述用户问句的答案。案。案。

【技术实现步骤摘要】
一种适用于多场景的智能问答方法、装置及存储介质


[0001]本申请涉及智能问答
,特别是涉及一种适用于多场景的智能问答方法、装置及存储介质。

技术介绍

[0002]在各行各业中,随着人工智能技术的成熟,对话系统、智能问答系统的应用得以逐步普及。在原有业务问答的基础上,对闲聊对话也提出了一定要求,例如:在银行大厅数字人智能对话场景下,为了提高在办理业务等待期间的用户体验,需要数字人可以与银行用户进行闲聊交互。虽然闲聊语料与业务语料具有一定差别,但是在银行场景下,用户的闲聊语句也容易被误判为非闲聊/业务语句,导致回答错误,准确率低。
[0003]针对上述的现有技术中存在的知识问答语料和闲聊语句容易被误判为意图类别,导致回答准确率低的技术问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本专利技术的实施例提供了一种适用于多场景的智能问答方法、装置及存储介质,以至少解决现有技术中存在的知识问答语料和闲聊语句容易被误判为意图类别,导致回答准确率低的技术问题。
[0005]根据本专利技术实施例的一个方面,提供了一种适用于多场景的智能问答方法,包括:建构意图语料库、知识问答语料库和闲聊语料库;基于所述意图语料库,对用户问句进行意图分类,确定所述用户问句包含的所有意图类别以及各个意图类别的置信度的预测结果;在根据所述预测结果判定所述用户问句包含的所有意图类别的置信度均不大于预设的一级置信度阈值的情况下,基于所述意图语料库、所述知识问答语料库和所述闲聊语料库,对所述用户问句进行文本匹配,确定与所述用户问句相匹配的所有文本数据以及各个文本数据对应的相似度;根据所述各个文本数据对应的相似度、预设的相似度阈值以及二级置信度阈值,确定所述用户问句的答案。
[0006]可选地,建构意图语料库、知识问答语料库和闲聊语料库,包括:针对业务语料进行意图标准问句、指示标准问句的梳理以及相似问句的扩写,得到意图语料库和知识问答语料库;对闲聊语料进行相似问句的扩写,得到闲聊语料库。
[0007]可选地,基于所述意图语料库,对用户问句进行意图分类之前,还包括:基于所述意图语料库、所述知识问答语料库和所述闲聊语料库,构建意图识别模型和文本匹配模型;从所述知识问答语料库和所述闲聊语料库从抽取预定数量的文本数据,并将抽取出的文本数据作为一个新的意图类别的样本数据;将所述新的意图类别的样本数据添加至所述意图语料库,得到优化后的意图语料库;利用优化后的意图语料库进行意图识别模型的训练。
[0008]可选地,基于所述意图语料库,对用户问句进行意图分类,确定所述用户问句包含的所有意图类别以及各个意图类别的置信度的预测结果,包括:利用训练后的意图识别模型,对所述用户问句进行意图预测,确定所述用户问句包含的所有意图类别以及各个意图
类别的置信度的预测结果。
[0009]可选地,对所述用户问句进行文本匹配之前,该方法还包括:根据所述预测结果,判定所述用户问句包含的置信度最高的意图类别的置信度是否大于预设的一级置信度阈值;在所述用户问句包含的置信度最高的意图类别的置信度大于预设的一级置信度阈值的情况下,将所述用户问句包含的置信度最高的意图类别确定为所述用户问句的意图,并将所述意图语料库中与所述置信度最高的意图类别对应的答案确定为所述用户问句的答案。
[0010]可选地,基于所述意图语料库、所述知识问答语料库和所述闲聊语料库,对所述用户问句进行文本匹配,确定与所述用户问句相匹配的所有文本数据以及各个文本数据对应的相似度,包括:利用所述文本匹配模型,将所述意图语料库、所述知识问答语料库和所述闲聊语料库的所有文本数据与所述用户问句进行相似度计算,确定与所述用户问句相匹配的所有文本数据以及各个文本数据对应的相似度。
[0011]可选地,根据所述各个文本数据对应的相似度、预设的相似度阈值以及二级置信度阈值,确定所述用户问句的答案,包括:根据所述各个文本数据对应的相似度,判断所述各个文本数据中是否存在相似度数值达到预设的相似度阈值的候选文本数据;在判断所述各个文本数据中存在相似度数值达到预设的相似度阈值的候选文本数据的情况下,进一步判断所述候选文本数据中是否存在达到预设的二级置信度阈值的意图类别的目标文本数据,若存在则将所述目标文本数据对应的意图和答案确定为所述用户问句对应的意图和答案,若不存在则将相似度数值最高的文本数据对应的意图和答案确定为所述用户问句的意图和答案;在判断所述各个文本数据中不存在相似度数值达到预设的相似度阈值的候选文本数据的情况下,将预设的兜底答案确定为所述用户问句的答案。
[0012]根据本专利技术实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上任意一项所述的方法。
[0013]根据本专利技术实施例的另一个方面,还提供了一种适用于多场景的智能问答装置,包括:语料库建构模块,用于建构意图语料库、知识问答语料库和闲聊语料库;意图识别模块,用于基于所述意图语料库,对用户问句进行意图分类,确定所述用户问句包含的所有意图类别以及各个意图类别的置信度的预测结果;文本匹配模块,用于在根据所述预测结果判定所述用户问句包含的所有意图类别的置信度均不大于预设的一级置信度阈值的情况下,基于所述意图语料库、所述知识问答语料库和所述闲聊语料库,对所述用户问句进行文本匹配,确定与所述用户问句相匹配的所有文本数据以及各个文本数据对应的相似度;答案确定模块,用于根据所述各个文本数据对应的相似度、预设的相似度阈值以及二级置信度阈值,确定所述用户问句的答案。
[0014]根据本专利技术实施例的另一个方面,还提供了一种适用于多场景的智能问答装置,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:建构意图语料库、知识问答语料库和闲聊语料库;基于所述意图语料库,对用户问句进行意图分类,确定所述用户问句包含的所有意图类别以及各个意图类别的置信度的预测结果;在根据所述预测结果判定所述用户问句包含的所有意图类别的置信度均不大于预设的一级置信度阈值的情况下,基于所述意图语料库、所述知识问答语料库和所述闲聊语料库,对所述用户问句进行文本匹配,确定与所述用户问句相匹配的所有文本数据以及各个文本数据对应的相似度;根据所述各个文本数据对应的相似度、预设的相似度阈值以及二级置信度
阈值,确定所述用户问句的答案。
[0015]在本专利技术实施例中,首先建构意图语料库、知识问答语料库和闲聊语料库。然后,基于意图语料库,对用户问句进行意图分类,确定用户问句包含的所有意图类别以及各个意图类别的置信度的预测结果。其次,在根据预测结果判定所述用户问句包含的所有意图类别的置信度均不大于预设的一级置信度阈值的情况下,基于意图语料库、知识问答语料库和闲聊语料库,对用户问句进行文本匹配,确定与所述用户问句相匹配的所有文本数据以及各个文本数据对应的相似度。最后,根据所述各个文本数据对应的相似度、预设的相似度阈值以及二级置信度阈值,确定所述用户问句的答案。本专利技术将知识问答语料和闲聊语本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种适用于多场景的智能问答方法,其特征在于,包括:建构意图语料库、知识问答语料库和闲聊语料库;基于所述意图语料库,对用户问句进行意图分类,确定所述用户问句包含的所有意图类别以及各个意图类别的置信度的预测结果;在根据所述预测结果判定所述用户问句包含的所有意图类别的置信度均不大于预设的一级置信度阈值的情况下,基于所述意图语料库、所述知识问答语料库和所述闲聊语料库,对所述用户问句进行文本匹配,确定与所述用户问句相匹配的所有文本数据以及各个文本数据对应的相似度;根据所述各个文本数据对应的相似度、预设的相似度阈值以及二级置信度阈值,确定所述用户问句的答案。2.根据权利要求1所述的方法,其特征在于,建构意图语料库、知识问答语料库和闲聊语料库,包括:针对业务语料进行意图标准问句、指示标准问句的梳理以及相似问句的扩写,得到意图语料库和知识问答语料库;对闲聊语料进行相似问句的扩写,得到闲聊语料库。3.根据权利要求1所述的方法,其特征在于,基于所述意图语料库,对用户问句进行意图分类之前,还包括:基于所述意图语料库、所述知识问答语料库和所述闲聊语料库,构建意图识别模型和文本匹配模型;从所述知识问答语料库和所述闲聊语料库从抽取预定数量的文本数据,并将抽取出的文本数据作为一个新的意图类别的样本数据;将所述新的意图类别的样本数据添加至所述意图语料库,得到优化后的意图语料库;利用优化后的意图语料库进行意图识别模型的训练。4.根据权利要求3所述的方法,其特征在于,基于所述意图语料库,对用户问句进行意图分类,确定所述用户问句包含的所有意图类别以及各个意图类别的置信度的预测结果,包括:利用训练后的意图识别模型,对所述用户问句进行意图预测,确定所述用户问句包含的所有意图类别以及各个意图类别的置信度的预测结果。5.根据权利要求1所述的方法,其特征在于,对所述用户问句进行文本匹配之前,还包括:根据所述预测结果,判定所述用户问句包含的置信度最高的意图类别的置信度是否大于预设的一级置信度阈值;在所述用户问句包含的置信度最高的意图类别的置信度大于预设的一级置信度阈值的情况下,将所述用户问句包含的置信度最高的意图类别确定为所述用户问句的意图,并将所述意图语料库中与所述置信度最高的意图类别对应的答案确定为所述用户问句的答案。6.根据权利要求3所述的方法,其特征在于,基于所述意图语料库、所述知识问答语料库和所述闲聊语料库,对所述用户问句进行文本匹配,确定与所述用户问句相匹配的所有文本数据以及各个文本数据对应的相似度,包括:
利用所述文本匹配模型,将所述意图语料库、所述知识问答语料库和所述闲聊语料库的所有文本数据与...

【专利技术属性】
技术研发人员:贾敬伍周长安赵国庆
申请(专利权)人:北京中关村科金技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1