一种适用于多场景的智能问答方法、装置及存储介质制造方法及图纸

技术编号：37057096 阅读：5 留言：0更新日期：2023-03-29 19:33

本申请公开了一种适用于多场景的智能问答方法、装置及存储介质，其中该方法，包括：建构意图语料库、知识问答语料库和闲聊语料库；基于所述意图语料库，对用户问句进行意图分类，确定所述用户问句包含的所有意图类别以及各个意图类别的置信度的预测结果；在根据所述预测结果判定所述用户问句包含的所有意图类别的置信度均不大于预设的一级置信度阈值的情况下，基于所述意图语料库、所述知识问答语料库和所述闲聊语料库，对所述用户问句进行文本匹配，确定与所述用户问句相匹配的所有文本数据以及各个文本数据对应的相似度；根据所述各个文本数据对应的相似度、预设的相似度阈值以及二级置信度阈值，确定所述用户问句的答案。案。案。

全部详细技术资料下载

【技术实现步骤摘要】
一种适用于多场景的智能问答方法、装置及存储介质

[0001]本申请涉及智能问答
，特别是涉及一种适用于多场景的智能问答方法、装置及存储介质。

技术介绍

[0002]在各行各业中，随着人工智能技术的成熟，对话系统、智能问答系统的应用得以逐步普及。在原有业务问答的基础上，对闲聊对话也提出了一定要求，例如：在银行大厅数字人智能对话场景下，为了提高在办理业务等待期间的用户体验，需要数字人可以与银行用户进行闲聊交互。虽然闲聊语料与业务语料具有一定差别，但是在银行场景下，用户的闲聊语句也容易被误判为非闲聊/业务语句，导致回答错误，准确率低。
[0003]针对上述的现有技术中存在的知识问答语料和闲聊语句容易被误判为意图类别，导致回答准确率低的技术问题，目前尚未提出有效的解决方案。

技术实现思路

[0004]本专利技术的实施例提供了一种适用于多场景的智能问答方法、装置及存储介质，以至少解决现有技术中存在的知识问答语料和闲聊语句容易被误判为意图类别，导致回答准确率低的技术问题。
[0005]根据本专利技术实施例的一个方面，提供了一种适用于多场景的智能问答方法，包括：建构意图语料库、知识问答语料库和闲聊语料库；基于所述意图语料库，对用户问句进行意图分类，确定所述用户问句包含的所有意图类别以及各个意图类别的置信度的预测结果；在根据所述预测结果判定所述用户问句包含的所有意图类别的置信度均不大于预设的一级置信度阈值的情况下，基于所述意图语料库、所述知识问答语料库和所述闲聊语料库，对所述用户问句进行文本匹配...

【技术保护点】

【技术特征摘要】
1.一种适用于多场景的智能问答方法，其特征在于，包括：建构意图语料库、知识问答语料库和闲聊语料库；基于所述意图语料库，对用户问句进行意图分类，确定所述用户问句包含的所有意图类别以及各个意图类别的置信度的预测结果；在根据所述预测结果判定所述用户问句包含的所有意图类别的置信度均不大于预设的一级置信度阈值的情况下，基于所述意图语料库、所述知识问答语料库和所述闲聊语料库，对所述用户问句进行文本匹配，确定与所述用户问句相匹配的所有文本数据以及各个文本数据对应的相似度；根据所述各个文本数据对应的相似度、预设的相似度阈值以及二级置信度阈值，确定所述用户问句的答案。2.根据权利要求1所述的方法，其特征在于，建构意图语料库、知识问答语料库和闲聊语料库，包括：针对业务语料进行意图标准问句、指示标准问句的梳理以及相似问句的扩写，得到意图语料库和知识问答语料库；对闲聊语料进行相似问句的扩写，得到闲聊语料库。3.根据权利要求1所述的方法，其特征在于，基于所述意图语料库，对用户问句进行意图分类之前，还包括：基于所述意图语料库、所述知识问答语料库和所述闲聊语料库，构建意图识别模型和文本匹配模型；从所述知识问答语料库和所述闲聊语料库从抽取预定数量的文本数据，并将抽取出的文本数据作为一个新的意图类别的样本数据；将所述新的意图类别的样本数据添加至所述意图语料库，得到优化后的意图语料库；利用优化后的意图语料库进行意图识别模型的训练。4.根据权利要求3所述的方法，其特征在于，基于所述意图语料库，对用户问句进行意图分类，确定所述用户问句包含的所有意图类别以及各个意图类别的置信度的预测结果，包括：利用训练后的意图识别模型，对所述用户问句进行意图预测，确定所述用户问句包含的所有意图类别以及各个意图类别的置信度的预测结果。5.根据权利要求1所述的方法，其特征在于，对所述用户问句进行文本匹配之前，还包括：根据所述预测结果，判定所述用户问句包含的置信度最高的意图类别的置信度是否大于预设的一级置信度阈值；在所述用户问句包含的置信度最高的意图类别的置信度大于预设的一级置信度阈值的情况下，将所述用户问句包含的置信度最高的意图类别确定为所述用户问句的意图，并将所述意图语料库中与所述置信度最高的意图类别对应的答案确定为所述用户问句的答案。6.根据权利要求3所述的方法，其特征在于，基于所述意图语料库、所述知识问答语料库和所述闲聊语料库，对所述用户问句进行文本匹配，确定与所述用户问句相匹配的所有文本数据以及各个文本数据对应的相似度，包括：
利用所述文本匹配模型，将所述意图语料库、所述知识问答语料库和所述闲聊语料库的所有文本数据与...

【专利技术属性】
技术研发人员：贾敬伍，周长安，赵国庆，
申请(专利权)人：北京中关村科金技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人