一种智能问答方法以及相关装置制造方法及图纸

技术编号:21629069 阅读:103 留言:0更新日期:2019-07-17 11:08
本申请实施例公开了一种智能问答方法以及相关装置,用于提升智能问答系统的准确度。本申请实施例方法包括:获取目标用户问题;根据问题优化模型生成与所述目标用户问题对应的目标生成问题,所述问题优化模型基于生成式对抗网络训练得到,所述问题优化模型包括生成器和判别器;根据所述判别器判断所述目标生成问题的生成质量是否高于第一预设阈值,所述生成质量用于指示所述目标生成问题为规范问题的概率;若是,则根据所述目标生成问题确定目标答案。

An Intelligent Question Answering Method and Related Devices

【技术实现步骤摘要】
一种智能问答方法以及相关装置
本申请涉及信息推荐
,尤其涉及一种智能问答方法以及相关装置。
技术介绍
在这个飞速发展的时代,能越多的节约人力资源,就是一种对生产力极大地解放。为了更好满足用户的需求并节约人力资源,越来越多的服务行业对用户提出的常见问题及其解答进行了整理,即将常见问题及其解答整理为规范的问题库形式,并基于该问题库创建了智能问答系统。其中,智能问答系统是一种处理自然语言的新型信息检索系统,以一问一答的形式,接收用户提出的问题,之后精确地定位该问题所涉及到的问答库中的相关知识,并根据系统中预设的业务处理流程进行业务游走,实现业务引导与用户之间进行交互,将相关知识作为对该问题的解答反馈给用户,完成智能问答。现有技术中,普遍采用的是基于规则(模板)匹配方法,其核心思想是针对每个标准问题,人工定义其不同的问法(称为模板或扩展问)。不同公司的模板形式也不尽相同。当用户输入一个问题后,基于模板的问答系统的步骤包括以下4步:1、对用户问题进行分析;2、从模板库中检索候选模板;3、对模板进行匹配程度评分;4、如果评分大于某个阈值,则输出该模板对应的答案;否则,认为系统无法回答,建议转人工客服。然而,在实际的问答系统中,用户对问题的描述和措辞各种各样,非常口语化甚至不正规,包括用词不规范如“怎么输入念证码不真确啊”、词序颠倒如“怎么还没有到啊,快递”等,由于在问答系统中能有效回答的问题集合仅仅局限于模板库对应的问题,例如,若用户的问题没有匹配上任何一个模板,则无法给出答案。因此这些不规范表述给现有问答系统的问题分析带来很大的困难,使得基于匹配和检索的问答系统很难理解用户的问题,进而找出准确的答案,降低了问答系统的准确度。
技术实现思路
本申请实施例提供了一种智能问答方法以及相关装置,用于提升智能问答系统的准确度。本申请实施例的第一方面提供了一种智能问答方法,包括:获取目标用户问题,并将该目标用户问题输入问题优化模型,以生成与该目标用户问题对应的目标生成问题,其中该问题优化模型基于生成式对抗网络训练得到,且问题优化模型包括生成器和判别器。得到目标生成问题后,再根据问题优化模型中的判别器判断该目标生成问题的生成质量是否高于第一预设阈值,其中生成质量用于指示该目标生成问题为规范问题的概率,若目标生成问题的生成质量高于第一预设阈值时,则根据目标生成问题确定目标答案。本申请实施例中,将用户输入的问题通过问题优化模型进行优化,以得到表述规范的目标生成问题,帮助用户更准确清晰的表达用户的需求,提升了与标准问题的匹配度,能更准确的找出目标答案,提升了智能问答系统的准确度。在一种可能的设计中,在本申请实施例第一方面的第一种实现方式中,所述获取目标用户问题之前,所述方法还包括:获得训练集,该训练集中包括源用户问题-源规范问题对,需要说明的是,所述源用户问题-源规范问题对用于表示源用户问题和与所述源用户问题对应的源规范问题的集合。本实现方式中,说明训练问题优化模型需要的准备工作之一:获得训练集,使得本申请实施例的流程更加完善。在一种可能的设计中,在本申请实施例第一方面的第二种实现方式中,所述获得训练集包括:计算标准数据集中的标准问题与用户日志中的各源用户问题的相似度值,所述标准数据集用于存储所述标准问题,所述用户日志包括用户与问答系统的交互记录。在得到相似度值后,将与所述标准问题的相似度值大于第二预设阈值的源用户问题作为候选用户问题,以确定所述候选用户问题中与所述标准问题语义一致的问题进而得到所述源用户问题-源规范问题对,所述标准问题包含于所述源规范问题。本实现方式中,说明了获得训练集的一种具体途径,通过标准数据库和用户日志来构造训练集,避免了人工撰写过程,降低了训练集构造成本,有利于扩大训练集规模。在一种可能的设计中,在本申请实施例第一方面的第三种实现方式中,所述获得训练集之后,所述获取目标用户问题之前,所述方法还包括:将所述训练集中的源用户问题输入至所述生成器,以使得所述生成器进行模型训练,并根据训练后的模型得到生成问题;获取所述生成器所得到的生成问题,并将所述生成问题保存在生成数据集中,所述生成数据集用于存储所述生成问题。本实现方式中,说明了训练生成器的具体方式,使得本申请实施例更加具有可操作性。在一种可能的设计中,在本申请实施例第一方面的第四种实现方式中,所述获得训练集之后,所述获取目标用户问题之前,所述方法还包括:将所述训练集中的源规范问题和所述生成数据集中的生成问题输入至所述判别器,以使得所述判别器以所述训练集中的源规范问题作为正例样本,以所述生成数据集中的生成问题作为负例样本进行模型训练;将所述生成器所生成的生成问题输入至所述判别器,以使得所述判别器对所述生成问题进行归属率判别,其中,所述归属率用于指示问题属于所述标准数据集或者所述生成数据集的概率;获取所述判别器对所述生成问题的判别结果;将所述判别结果输入至所述生成器,以使得所述生成器根据所述判别器所判别的生成问题以及所述判别结果进行模型训练,并根据训练后的模型生成新的生成问题;获取所述生成器所生成的新的生成问题,并将所述新的生成问题保存在所述生成数据集中。本实现方式中,提供了问题优化模型中的判别器和生成器如何进行对抗训练的方式,使得本申请实施例的步骤更加完善。在一种可能的设计中,在本申请实施例第一方面的第五种实现方式中,所述方法还包括:当所述判别器判别所述生成器生成的问题所得到的判别结果的变化量小于第三预设阈值时,则停止向所述判别器输入所述生成器生成的问题,并停止向所述生成器输入所述判别器的判别结果,以结束对所述问题优化模型的训练。本实现方式中,提供了结束问题优化模型需满足的条件之一:变化量收敛,使得本申请实施例更加具有可行性。在一种可能的设计中,在本申请实施例第一方面的第六种实现方式中,所述方法还包括:当迭代次数达到第四预设阈值时,则停止向所述判别器输入所述生成器生成的问题,并停止向所述生成器输入所述判别器的判别结果,以结束对所述问题优化模型的训练,所述生成器生成一次问题以及所述判断器判断一次所述生成器生成的问题表示一次迭代。本实现方式中,还提供了结束问题优化模型需满足的条件之一:迭代次数满足预置的最大迭代次数,使得本申请实施例更加具有可行性。在一种可能的设计中,在本申请实施例第一方面的第七种实现方式中,所述根据所述目标生成问题确定目标答案包括:根据所述目标生成问题在标准数据集中匹配目标标准问题,所述目标标准问题与所述目标生成问题的相似度值大于第五预设阈值;确定所述目标标准问题在所述标准数据集中对应的答案为所述目标答案,所述标准数据集用于存储所述标准问题。本实现方式中,提供了根据目标生成问题确定目标答案的具体操作,包括在标准数据集中找到与目标生成问题相似的目标标准问题,并将目标标准问题对应的答案作为目标答案,实现了目标用户问题到规范问题的改写,大大降低人工的成本,提升大规模用户问题优化的效果。在一种可能的设计中,在本申请实施例第一方面的第八种实现方式中,所述根据所述判别器判断所述目标生成问题的可信度是否高于第一预设阈值后,所述方法还包括:若所述判别器判断所述目标生成问题的可信度不高于第一预设阈值,则输出所述目标用户问题。本实现方式中,还说明了当本文档来自技高网
...

【技术保护点】
1.一种智能问答方法,其特征在于,包括:获取目标用户问题;根据问题优化模型生成与所述目标用户问题对应的目标生成问题,所述问题优化模型基于生成式对抗网络训练得到,所述问题优化模型包括生成器和判别器;根据所述判别器判断所述目标生成问题的生成质量是否高于第一预设阈值,所述生成质量用于指示所述目标生成问题为规范问题的概率;若是,则根据所述目标生成问题确定目标答案。

【技术特征摘要】
1.一种智能问答方法,其特征在于,包括:获取目标用户问题;根据问题优化模型生成与所述目标用户问题对应的目标生成问题,所述问题优化模型基于生成式对抗网络训练得到,所述问题优化模型包括生成器和判别器;根据所述判别器判断所述目标生成问题的生成质量是否高于第一预设阈值,所述生成质量用于指示所述目标生成问题为规范问题的概率;若是,则根据所述目标生成问题确定目标答案。2.根据权利要求1所述的方法,其特征在于,所述获取目标用户问题之前,所述方法还包括:获得训练集,所述训练集包括源用户问题-源规范问题对,所述源用户问题-源规范问题对用于表示源用户问题和与所述源用户问题对应的源规范问题的集合。3.根据权利要求2所述的方法,其特征在于,所述获得训练集包括:计算标准数据集中的标准问题与用户日志中的各源用户问题的相似度值,所述标准数据集用于存储所述标准问题,所述用户日志包括用户与问答系统的交互记录;将与所述标准问题的相似度值大于第二预设阈值的源用户问题作为候选用户问题,以确定所述候选用户问题中与所述标准问题语义一致的问题进而得到所述源用户问题-源规范问题对,所述标准问题包含于所述源规范问题。4.根据权利要求3所述的方法,其特征在于,所述获得训练集之后,所述获取目标用户问题之前,所述方法还包括:将所述训练集中的源用户问题输入至所述生成器,以使得所述生成器进行模型训练,并根据训练后的模型得到生成问题;获取所述生成器所得到的生成问题,并将所述生成问题保存在生成数据集中,所述生成数据集用于存储所述生成问题。5.根据权利要求4所述的方法,其特征在于,所述获得训练集之后,所述获取目标用户问题之前,所述方法还包括:将所述训练集中的源规范问题和所述生成数据集中的生成问题输入至所述判别器,以使得所述判别器以所述训练集中的源规范问题作为正例样本,以所述生成数据集中的生成问题作为负例样本进行模型训练;将所述生成器所生成的生成问题输入至所述判别器,以使得所述判别器对所述生成问题进行归属率判别,其中,所述归属率用于指示问题属于所述标准数据集或者所述生成数据集的概率;获取所述判别器对所述生成问题的判别结果;将所述判别结果输入至所述生成器,以使得所述生成器根据所述判别器所判别的生成问题以及所述判别结果进行模型训练,并根据训练后的模型生成新的生成问题;获取所述生成器所生成的新的生成问题,并将所述新的生成问题保存在所述生成数据集中。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:当所述判别器判别所述生成器生成的问题所得到的判别结果的变化量小于第三预设阈值时,则停止向所述判别器输入所述生成器生成的问题,并停止向所述生成器输入所述判别器的判别结果,以结束对所述问题优化模型的训练。7.根据权利要求5所述的方法,其特征在于,所述方法还包括:当迭代次数达到第四预设阈值时,则停止向所述判别器输入所述生成器生成的问题,并停止向所述生成器输入所述判别器的判别结果,以结束对所述问题优化模型的训练,所述生成器生成一次问题以及所述判断器判断一次所述生成器生成的问题表示一次迭代。8.根据权利要求1至7中任一项所述的方法,其特征在于,所述根据所述目标生成问题确定目标答案包括:根据所述目标生成问题在标准数据集中匹配目标标准问题,所述目标标准问题与所述目标生成问题的相似度值大于第五预设阈值;确定所述目标标准问题在所述标准数据集中对应的答案为所述目标答案,所述标准数据集用于存储所述标准问题。9.根据权利要求1所述的方法,其特征在于,所述根据所述判别器判断所述目标生成问题的可信度是否高于第一预设阈值后,所述方法还包括:若所述判别器判断所述目标生成问题的可信度不高于第一预设阈值,则输出所述目标用户问题。10.一种智能问答装置,其特征在于,包括:获取单元,用于获取目标用户问题;生成单元,用于根据问题优化模型生成与所述目标用户问题对应的目标生成问题,所述问题优化模型基于生成式对抗网络训练得到,所述问题优化模型包括生成器和判别器;判断单元,用于...

【专利技术属性】
技术研发人员:晏小辉徐传飞蒋洪睿
申请(专利权)人:杭州华为数字技术有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1