对话生成方法、装置、设备及计算机可读介质制造方法及图纸

技术编号：19778449 阅读：20 留言：0更新日期：2018-12-15 11:21

本发明专利技术提出一种对话生成方法、装置、设备及计算机可读介质。所述对话生成方法，包括：获取输入的原始语句信息；根据所述原始语句信息在搜索行为数据中进行查询，获得所述原始语句信息的扩展信息；将所述原始语句信息和所述扩展信息输入对话生成模型，通过所述对话生成模型输出回复语句。本发明专利技术实施例可以提高计算效率，降低计算时间消耗，另外通过对输入的语句信息进行扩展，可以增加回复生成的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
对话生成方法、装置、设备及计算机可读介质
本专利技术涉及人工智能领域，尤其涉及一种基于检索日记的对话生成方法及装置、设备和计算机可读介质。
技术介绍
通用对话系统作为人工智能的重要场景，得到越来越多的关注，典型的工业界应用包括：聊天机器人、手机助手等。而在通用对话系统中，进行对话的生成是重要的一个环境，目前主流的方法包括两种：检索式和自然语言生成。检索式的方法是通过用户输入的句子在语料中进行检索，找到一些相关的回复，效果很受语料的限制，对应语料中没有相关的句子则无法回复用户。因此基于自然语言生成的方式越来越受到重视，使用的是端到端(end2end)的框架，最常用的为序列到序列(seq2seq，sequencetosequence)。但是使用自然语言生成的方式面临着生成安全回复的重要问题，会生成一些没有信息含量与上文没有关联的通用回复，例如：『我不知道啊』，『不错不错』。在实际应用中生成这些回复会严重影响用户的体验。为了解决生成没有信息含量和无关联回复的问题，现有技术提出了在生成的过程中加入关键词进行辅助，或者使用最大交互信息(MaximumMutualInformation,MMI)的方法对生成结果进行筛选。然而，现有技术仍存在以下问题：1、引入关键词的方法主要的难点在于针对对话进行关键词的抽取，这是一个相当难的问题，现阶段没有比较好的方法可以获取到在对话上的关键词。2、使用MMI对结果进行筛选的则大大增加了整个流程的计算量，为了获取满足应用的效果可能需要消耗上千倍的时间，因此不满足实际应用。
技术实现思路
本专利技术实施例提供一种对话生成方法、装置、设备及计...

【技术保护点】
1.一种对话生成方法，其特征在于，包括：获取输入的原始语句信息；根据所述原始语句信息在搜索行为数据中进行查询，获得所述原始语句信息的扩展信息；将所述原始语句信息和所述扩展信息输入对话生成模型，通过所述对话生成模型输出回复语句。

【技术特征摘要】
1.一种对话生成方法，其特征在于，包括：获取输入的原始语句信息；根据所述原始语句信息在搜索行为数据中进行查询，获得所述原始语句信息的扩展信息；将所述原始语句信息和所述扩展信息输入对话生成模型，通过所述对话生成模型输出回复语句。2.根据权利要求1所述的对话生成方法，其特征在于，所述对话生成模型包括编码器和解码器，将所述原始语句信息和所述扩展信息输入对话生成模型，通过所述对话生成模型输出回复语句，包括：将所述原始语句信息和所述扩展信息输入编码器，通过所述编码器分别生成原始语句向量和扩展语句向量；将所述原始语句向量和所述扩展语句向量输入解码器，通过所述解码器生成回复语句。3.根据权利要求2所述的对话生成方法，其特征在于，将所述原始语句向量和所述扩展语句向量输入解码器，通过所述解码器生成回复语句，包括：将所述原始语句向量和所述扩展语句向量联合作为所述解码器的初始向量；将所述初始向量作为所述解码器的初始输入，逐个生成所述回复语句的每个字。4.根据权利要求2所述的对话生成方法，其特征在于，将所述原始语句向量和所述扩展语句向量输入解码器，通过所述解码器生成回复语句，包括：将所述原始语句向量和所述扩展语句向量联合作为所述解码器的初始向量；根据初始向量生成回复语句输出第一个字，并依次将上一个字和扩展向量作为下一个字的初始向量，逐个生成所述回复语句的每个字。5.根据权利要求1至4中任一项所述的对话生成方法，其特征在于，还包括：采用训练数据生成所述对话生成模型，所述对话生成模型是基于循环神经网络构建的。6.一种对话生成装置，其特征在于，包括：获取模块，用于获取输入的原始语句信息；扩展模块，用于根据所述原始语句信息在搜索行为数据中进行查询，获得所述原始语句信息的扩展信...

【专利技术属性】
技术研发人员：连荣忠，彭金华，马宗阳，姜迪，何径舟，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人