生成式多轮闲聊对话方法、系统及计算机可读存储介质技术方案

技术编号：19215801 阅读：45 留言：0更新日期：2018-10-20 06:45

本发明专利技术公开了生成式多轮闲聊对话方法、系统及计算机可读存储介质，分为两个阶段：阶段一：利用语料库的对话，对多轮闲聊对话模型进行训练；阶段二：将用户提出的待答复的问题输入到训练好的多轮闲聊对话模型中，输出实际答复。通过挖掘对话历史中的关键词、在模型中引入注意力机制，将对话历史中的所有词区别对待，扩大了历史对话中关键词在生成回复时的作用。通过宽度通道来预测关键词拓宽话题，通过深度通道来预测历史对话中关键词的权重，以此来深入当前话题，将两部分得到的话题信息引入解码器中辅助解码，话题信息的引导有效地解决了无意义回复的问题，大大减少了无意义回复的数量。

全部详细技术资料下载

【技术实现步骤摘要】
生成式多轮闲聊对话方法、系统及计算机可读存储介质
本专利技术涉及一种生成式多轮闲聊对话方法、系统及计算机可读存储介质。
技术介绍
对话系统，也被称为智能对话体或者聊天机器人，已经被广泛应用于各种生活场景中，包括客服、娱乐闲聊、情感陪护、知识共享等等。从用途上，对话系统可以大致分为闲聊对话系统和以任务为导向的对话系统。从技术上，对话系统可以分为基于规则、基于检索、基于生成的对话系统，其中，基于规则的对话系统需要耗费大量的人力资源来设计规则，基于检索的对话系统严重依赖于语料库的质量和大小，并且基于规则或者检索的对话系统严重限制了生成回复的多样性。基于生成的对话系统能够生成更灵活的回复，也是近年来研究人员重点努力的一个方向。基于生成的闲聊对话系统包括单轮对话闲聊系统和多轮对话闲聊系统。单轮对话的闲聊系统主要的实现技术是基于编码器-译码器框架，利用人人对话语料来训练一个神经网络，将对话语料组织成提问-回复对，将提问、回复分别作为模型的输入和输出来训练网络模型。单轮对话系统面临的一个问题是模型忽略了对话历史对当前回复的影响。虽然有很多研究工作提高了多轮对话闲聊系统的表现，但是它仍面临一些问题，其中一个较为突出的问题是多轮对话闲聊系统经常生成无意义回复的问题。比如，对话系统经常生成“我不知道”、“我也是”等无意义回复。这种无意义回复的生成主要是因为在语料库中这种回复所占的比例较高，使得训练的模型倾向于生成较为普遍的无意义回复。
技术实现思路
为了解决现有技术的不足，本专利技术提供了一种生成式多轮闲聊对话方法、系统及计算机可读存储介质；作为本专利技术的第一方面，提供了一种生...

【技术保护点】
1.一种生成式多轮闲聊对话方法，其特征是，分为两个阶段：阶段一：利用语料库的对话，对多轮闲聊对话模型进行训练；阶段二：将用户已经发生的对话或新提出的待答复的问题作为对话历史输入到训练好的多轮闲聊对话模型中，输出实际答复。

【技术特征摘要】
1.一种生成式多轮闲聊对话方法，其特征是，分为两个阶段：阶段一：利用语料库的对话，对多轮闲聊对话模型进行训练；阶段二：将用户已经发生的对话或新提出的待答复的问题作为对话历史输入到训练好的多轮闲聊对话模型中，输出实际答复。2.如权利要求1所述的一种生成式多轮闲聊对话方法，其特征是，所述利用语料库的对话，对多轮闲聊对话模型进行训练，包括：步骤(1)：构建多轮闲聊对话模型，所述多轮闲聊对话模型包括：关键词抽取模块、宽度通道、全局通道、深度通道和解码器；所述宽度通道和深度通道并列设置，全局通道的输出分别作为宽度通道和深度通道的输入；所述宽度通道内设置有基于注意力机制的循环神经网络；所述全局通道内设置编码器；所述深度通道内设置深度神经网络；所述宽度通道和深度通道的输入端均与关键词抽取模块连接；所述宽度通道、全局通道和深度通道的输出端均与解码器连接，所述解码器内设有基于注意力机制的循环神经网络；步骤(2)：将语料库中的对话分为历史对话和当前答复，所述历史对话和当前答复是相对而言的，所述历史对话，是指当前答复之前的对话内容；历史对话发生的时刻在当前答复发生的时刻之前；所述历史对话包括已知的若干组对话；然后，抽取历史对话的关键词；步骤(3)：将语料库中的历史对话输入到全局通道的编码器中进行编码，生成上下文向量；步骤(4)：将步骤(2)得到的历史对话的关键词和步骤(3)得到的上下文向量，输入到宽度通道的基于注意力机制的循环神经网络，输出用来拓宽话题的预测关键词，并将预测关键词编码为对应的预测关键词的编码向量；步骤(5)：将步骤(2)得到的历史对话的关键词和步骤(3)得到的上下文向量，输入到深度通道的深度神经网络，输出历史对话中关键词的权重，基于权重得到加权后的历史对话关键词编码向量；步骤(6)：将步骤(3)得到的上下文向量、步骤(4)得到的预测关键词的编码向量和步骤(5)得到的加权后的历史对话关键词编码向量均输入到解码器的基于注意力机制的循环神经网络中，输出回复结果；步骤(7)：将步骤(6)得到的回复结果，与步骤(2)中的当前回复进行比较，计算交叉熵，得到损失函数，利用梯度下降算法对多轮闲聊对话模型进行优化，得到训练好的多轮闲聊对话模型。3.如权利...

【专利技术属性】
技术研发人员：王文杰，聂礼强，黄民烈，宋雪萌，王英龙，
申请(专利权)人：山东大学，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人