一种对话生成的方法、装置、存储介质及电子设备制造方法及图纸

技术编号：22329770 阅读：12 留言：0更新日期：2019-10-19 12:12

本发明专利技术提供了一种对话生成的方法、装置、存储介质及电子设备，其中，该方法包括：获取源序列，根据源序列生成具有最大概率的、预设数量的目标序列，并确定每个目标序列的正向概率；确定每个目标序列的反向概率；根据每个目标序列的正向概率和反向概率分别确定每个目标序列的双向互信息，双向互信息与正向概率和反向概率之间均为正相关关系；将具有最大双向互信息的目标序列作为与源序列相对应的有效序列。通过本发明专利技术实施例提供的对话生成的方法、装置、存储介质及电子设备，可以更加准确地得到高质量、有用的下文回复，减少对话过程中生成无意义的回复。

全部详细技术资料下载

【技术实现步骤摘要】
一种对话生成的方法、装置、存储介质及电子设备
本专利技术涉及对话生成的
，具体而言，涉及一种对话生成的方法、装置、存储介质及电子设备。
技术介绍
在现有的对话系统中，一般利用序列到序列模型(sequence-to-sequencemodel)生成对话回复。基于深度学习的序列到序列模型是编码-解码(encoder-decoder模型)，其提供了一种基于源语言序列(source，也就是上文)，生成目标语言序列(target，也就是对话回复)的普适解决方法。然而，在对话系统中，序列到序列模型存在着非常严重的一个问题，就是不管用户输入的句子是什么，系统的回复都是高频的通用回复，比如“我不知道”、“那太好了”等。例子1：用户句子：你在哪里出生？系统应答：我不知道。例子2：用户句子：你今年几岁了？系统应答：我不知道。例子3：用户句子：我要去杭州出差。系统应答：那太好了！
技术实现思路
为解决上述问题，本专利技术实施例的目的在于提供一种对话生成的方法、装置、存储介质及电子设备。第一方面，本专利技术实施例提供了一种对话生成的方法，包括：获取源序列，根据所述源序列生成具有最大概率的、预设数量的目标序列，并确定每个所述目标序列的正向概率，所述正向概率为基于所述源序列生成所述目标序列的概率；确定每个所述目标序列的反向概率，所述反向概率为基于所述目标序列预测生成所述源序列的概率；根据每个所述目标序列的正向概率和反向概率分别确定每个所述目标序列的双向互信息，所述双向互信息与所述正向概率和所述反向概率之间均为正相关关系；将具有最大双向互信息的目标序列作为与所述源序列相对应的有效序列...

【技术保护点】
1.一种对话生成的方法，其特征在于，包括：获取源序列，根据所述源序列生成具有最大概率的、预设数量的目标序列，并确定每个所述目标序列的正向概率，所述正向概率为基于所述源序列生成所述目标序列的概率；确定每个所述目标序列的反向概率，所述反向概率为基于所述目标序列预测生成所述源序列的概率；根据每个所述目标序列的正向概率和反向概率分别确定每个所述目标序列的双向互信息，所述双向互信息与所述正向概率和所述反向概率之间均为正相关关系；将具有最大双向互信息的目标序列作为与所述源序列相对应的有效序列。

【技术特征摘要】
1.一种对话生成的方法，其特征在于，包括：获取源序列，根据所述源序列生成具有最大概率的、预设数量的目标序列，并确定每个所述目标序列的正向概率，所述正向概率为基于所述源序列生成所述目标序列的概率；确定每个所述目标序列的反向概率，所述反向概率为基于所述目标序列预测生成所述源序列的概率；根据每个所述目标序列的正向概率和反向概率分别确定每个所述目标序列的双向互信息，所述双向互信息与所述正向概率和所述反向概率之间均为正相关关系；将具有最大双向互信息的目标序列作为与所述源序列相对应的有效序列。2.根据权利要求1所述的方法，其特征在于，所述根据所述源序列生成具有最大概率的、预设数量的目标序列，并确定每个所述目标序列的正向概率，包括：根据所述源序列选取N个最大概率的第一候选词，每个所述第一候选词生成一个候选序列；在当前解码时刻，基于所述源序列和当前的N个所述候选序列，确定每个所述候选序列对应的M个最大概率的第二候选词，分别将M个所述第二候选词添加至相应的所述候选序列中，生成N×M个新的候选序列；根据所述候选序列所包含的所有候选词的概率确定每个候选序列的概率，并在N×M个候选序列中选取N个最大概率的候选序列；之后将下一解码时刻作为新的当前解码时刻，重复上述在当前解码时刻选取N个最大概率的候选序列的过程，直至解码过程结束；将最终选取的N个最大概率的候选序列作为目标序列，且所述目标序列的正向概率为相应的候选序列的概率。3.根据权利要求1所述的方法，其特征在于，所述确定每个所述目标序列的反向概率包括：基于编码模型确定所述目标序列的编码隐状态；基于解码模型，在当前解码阶段，根据所述编码隐状态确定所述源序列的每个源分词的概率，所述源分词为对所述源序列进行分词处理后所确定的分词；根据所有所述源分词的概率生成所述目标序列的反向概率。4.根据权利要求3所述的方法，其特征在于，所述根据所述编码隐状态确定所述源序列的每个源分词的概率包括：在当前解码阶段，确定所述编码模型每个编码阶段的编码隐状态的权重，并根据所述编码模型每个编码阶段的编码隐状态以及相应的权重确定在当前解码阶段的上下文向量；根据当前解码阶段的上下文向量、上一解码阶段的解码隐状态、上一解码阶段所对应源分词，确定当前解码阶段的解码隐状态以及当前解码阶段所对应的源分词的概率；之后将下一解码阶段作为当前解码阶段，重复上述确定解码隐状态以及源分词的概率的过程，直至确定所有源分词的概率。5.根据权利要求4所述的方法，其特征在于，所述根据所述编码模型每个编码阶段的编码隐状态以...

【专利技术属性】
技术研发人员：李纪为，
申请(专利权)人：北京香侬慧语科技有限责任公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人