【技术实现步骤摘要】
一种基于主动学习的问答方法、系统、设备及介质
[0001]本专利技术涉及智能问答领域,尤其是涉及一种基于主动学习的问答方法、系统、设备及介质。
技术介绍
[0002]可以实现与用户的闲聊,随着企业对客户服务的重视,聊天机器人从娱乐领域逐渐向客户服务等领域发展。
[0003]由于聊天机器人无法自行回答技术问题,现在通常的做法是收集许多由“问题
‑
答案”组成的问答对,构建知识库来提供支持。当用户提问时,聊天机器人在知识库中搜索最为相关的问题,提取答案进行回复。
[0004]知识库的完善程度决定了用户的体验,无论搜索技术与相似匹配技术多么完善,如果相关的问题在知识库中没有存储,聊天机器人就无法回答用户的问题。为了完善知识库,可以会定期收集问答系统无法回答的问题,交由专家标注,向知识库中补充相应问答对。但由于专家的人力有限,未解答的问题的数量级又比较大,专家不仅难以及时标注所有问题,也无法从众多候选中找到高频的问题进行优先标注。当多个专家同时标注时,还可能因为相似问题产生重复标注,浪费人力。 >
技术实现思路
...
【技术保护点】
【技术特征摘要】
1.一种基于主动学习的问答方法,其特征在于,包括以下步骤:S1:构建基础知识库,所述基础知识库内包括已知问题和已知问题对应的回答;S2:基于相似度检测模型进行客户问答并构建未解答问题集,所述的未解答问题集包括用户反馈为问题未解答的用户问题;S3:对未解答问题集中的问题进行类别划分;S4:获取专家修正信息,基于专家修正信息对对划分好类别的未解答问题集进行类别修正;S5:基于类别修正结果对相似度检测模型进行优化训练;S6:获取未解答问题集中每一个类别的对应回答,将问题和对应回答更新到基础知识库中。2.根据权利要求1所述的一种基于主动学习的问答方法,其特征在于,所述的步骤S2具体包括:S21:建立文本相似度检测模型;S22:获取用户待答问题并在基础知识库中通过文本相似度检测模型搜索相似度最高的已知问题的回答作为回答输出;S23:构建未解答问题集,获取用户反馈,若用户反馈为问题未解答,则将对应问题存入未解答问题集中。3.根据权利要求1所述的一种基于主动学习的问答方法,其特征在于,所述的步骤S3具体包括:S31:在未解答问题集中选取第一问题作为第一类别的基准问题;S32:在未解答问题集中选取待分类问题与所有类别的基准问题逐个进行相似度计算,若所有类别中存在类别的基准问题与待分类问题的相似度大于相似度阈值,则将待分类问题判定为该类别,否则将待分类问题作为新的类别的基准问题;S33:重复步骤S32直到未解答问题集所有的问题都完成类别划分。4.根据权利要求1所述的一种基于主动学习的问答方法,其特征在于,所述的专家修正信息包括类型合并指令、类型拆分指令、问题移动指令,所述的类型合并指令为将未解答问题集中的两个类别及对应的问题合并为一个类型;所述的类型拆分指令为将未解答问题集中的一个类别及问题分为两个类型及对应的问题;所述的问题移动指令为将一类别中的一个或多个问题移动到另一类别中。5.根据权利要求1所述的...
【专利技术属性】
技术研发人员:冯耀,王椭,朱祥,熊赏,陈娜,陆恒宇,罗浩昇,赵权有,
申请(专利权)人:上海浦东发展银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。