对话生成方法、装置、设备及计算机可读介质制造方法及图纸

技术编号:19778449 阅读:20 留言:0更新日期:2018-12-15 11:21
本发明专利技术提出一种对话生成方法、装置、设备及计算机可读介质。所述对话生成方法,包括:获取输入的原始语句信息;根据所述原始语句信息在搜索行为数据中进行查询,获得所述原始语句信息的扩展信息;将所述原始语句信息和所述扩展信息输入对话生成模型,通过所述对话生成模型输出回复语句。本发明专利技术实施例可以提高计算效率,降低计算时间消耗,另外通过对输入的语句信息进行扩展,可以增加回复生成的准确性。

【技术实现步骤摘要】
对话生成方法、装置、设备及计算机可读介质
本专利技术涉及人工智能领域,尤其涉及一种基于检索日记的对话生成方法及装置、设备和计算机可读介质。
技术介绍
通用对话系统作为人工智能的重要场景,得到越来越多的关注,典型的工业界应用包括:聊天机器人、手机助手等。而在通用对话系统中,进行对话的生成是重要的一个环境,目前主流的方法包括两种:检索式和自然语言生成。检索式的方法是通过用户输入的句子在语料中进行检索,找到一些相关的回复,效果很受语料的限制,对应语料中没有相关的句子则无法回复用户。因此基于自然语言生成的方式越来越受到重视,使用的是端到端(end2end)的框架,最常用的为序列到序列(seq2seq,sequencetosequence)。但是使用自然语言生成的方式面临着生成安全回复的重要问题,会生成一些没有信息含量与上文没有关联的通用回复,例如:『我不知道啊』,『不错不错』。在实际应用中生成这些回复会严重影响用户的体验。为了解决生成没有信息含量和无关联回复的问题,现有技术提出了在生成的过程中加入关键词进行辅助,或者使用最大交互信息(MaximumMutualInformation,MMI)的方法对生成结果进行筛选。然而,现有技术仍存在以下问题:1、引入关键词的方法主要的难点在于针对对话进行关键词的抽取,这是一个相当难的问题,现阶段没有比较好的方法可以获取到在对话上的关键词。2、使用MMI对结果进行筛选的则大大增加了整个流程的计算量,为了获取满足应用的效果可能需要消耗上千倍的时间,因此不满足实际应用。
技术实现思路
本专利技术实施例提供一种对话生成方法、装置、设备及计算机可读介质,以解决或缓解现有技术中的一个或多个技术问题。第一方面,本专利技术实施例提供了一种对话生成方法,包括:获取输入的原始语句信息;根据所述原始语句信息在搜索行为数据中进行查询,获得所述原始语句信息的扩展信息;将所述原始语句信息和所述扩展信息输入对话生成模型,通过所述对话生成模型输出回复语句。结合第一方面,本专利技术实施例在第一方面的第一种实施方式中,所述对话生成模型包括编码器和解码器,将所述原始语句信息和所述扩展信息输入对话生成模型,通过所述对话生成模型输出回复语句,包括:将所述原始语句信息和所述扩展信息输入编码器,通过所述编码器分别生成原始语句向量和扩展语句向量;将所述原始语句向量和所述扩展语句向量输入解码器,通过所述解码器生成回复语句。结合第一方面的第一种实施方式,本专利技术实施例在第一方面的第二种实施方式中,将所述原始语句向量和所述扩展语句向量输入解码器,通过所述解码器生成回复语句,包括:将所述原始语句向量和所述扩展语句向量联合作为所述解码器的初始向量;将所述初始向量作为所述解码器的初始输入,逐个生成所述回复语句的每个字。结合第一方面的第一种实施方式,本专利技术实施例在第一方面的第三种实施方式中,将所述原始语句向量和所述扩展语句向量输入解码器,通过所述解码器生成回复语句,包括:将所述原始语句向量和所述扩展语句向量联合作为所述解码器的初始向量;根据初始向量生成回复语句输出第一个字,并依次将上一个字和扩展向量作为下一个字的初始向量,逐个生成所述回复语句的每个字。结合第一方面或第一方面中任意一种实施方式,还包括:采用训练数据生成所述对话生成模型,所述对话生成模型是基于循环神经网络构建的。第二方面,本专利技术实施例还提供了一种对话生成装置,包括:获取模块,用于获取输入的原始语句信息;扩展模块,用于根据所述原始语句信息在搜索行为数据中进行查询,获得所述原始语句信息的扩展信息;生成模块,用于将所述原始语句信息和所述扩展信息输入对话生成模型,通过所述对话生成模型输出回复语句。结合第二方面,本专利技术实施例在第二方面的第一种实施方式中,所述对话生成模型包括编码器和解码器,所述生成模块包括:信息输入子模块,用于将所述原始语句信息和所述扩展信息输入编码器,通过所述编码器分别生成原始语句向量和扩展语句向量;语句生成子模块,用于将所述原始语句向量和所述扩展语句向量输入解码器,通过所述解码器生成回复语句。结合第二方面的第一种实施方式,本专利技术实施例在第二方面的第二种实施方式中,所述语句生成子模块包括:第一联合单元,用于将所述原始语句向量和所述扩展语句向量联合作为所述解码器的初始向量;第一生成单元,用于将所述初始向量作为所述解码器的初始输入,逐个生成所述回复语句的每个字。结合第二方面的第一种实施方式,本专利技术实施例在第二方面的第三种实施方式中,所述语句生成子模块包括:第二联合单元,用于将所述原始语句向量和所述扩展语句向量联合作为所述解码器的初始向量;第二生成单元,用于根据初始向量生成回复语句输出第一个字,并依次将上一个字和扩展向量作为下一个字的初始向量,逐个生成所述回复语句的每个字。结合第二方面或第二方面中的任意一种实施方式,本专利技术实施例在第二方面的第四种实施方式中,还包括:模型训练模块,用于采用训练数据生成所述对话生成模型,所述对话生成模型是基于循环神经网络构建的。所述装置的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。第三方面,在一个可能的设计中,对话生成装置的结构中包括处理器和存储器,所述存储器用于存储支持对话生成装置执行上述第一方面中对话生成方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述对话生成装置还可以包括通信接口,用于对话生成装置与其他设备或通信网络通信。第四方面,本专利技术实施例提供了一种计算机可读介质,用于存储对话生成装置所用的计算机软件指令,其包括用于执行上述第一方面的对话生成方法所涉及的程序。本专利技术实施例可以提高计算效率,降低计算时间消耗,另外通过对输入的语句信息进行扩展,可以增加回复生成的准确性。上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本专利技术进一步的方面、实施方式和特征将会是容易明白的。附图说明在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本专利技术公开的一些实施方式,而不应将其视为是对本专利技术范围的限制。图1为本专利技术实施例的对话生成方法的流程图;图2为本专利技术实施例的对话生成模型的示意图;图3为本专利技术实施例的步骤S300的具体步骤流程图;图4为本专利技术一实施例的步骤S320的具体步骤流程图;图5为本专利技术一实施例的解码器示意图;图6为本专利技术另一实施例的步骤S320的具体步骤流程图;图7为本专利技术另一实施例的解码器示意图;图8为本专利技术实施例的整体架构图;图9为本专利技术一实施例的对话生成装置的模块框图;图10为本专利技术另一实施例的对话生成装置的模块框图;图11为本专利技术一实施例的生成模块的框图;图12为本专利技术一实施例的语句生成子模块的框图;图13为本专利技术另一实施例的语句生成子模块的框图;图14为本专利技术另一实施例的对话生成设备框图。具体实施方式在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本专利技术的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是本文档来自技高网...

【技术保护点】
1.一种对话生成方法,其特征在于,包括:获取输入的原始语句信息;根据所述原始语句信息在搜索行为数据中进行查询,获得所述原始语句信息的扩展信息;将所述原始语句信息和所述扩展信息输入对话生成模型,通过所述对话生成模型输出回复语句。

【技术特征摘要】
1.一种对话生成方法,其特征在于,包括:获取输入的原始语句信息;根据所述原始语句信息在搜索行为数据中进行查询,获得所述原始语句信息的扩展信息;将所述原始语句信息和所述扩展信息输入对话生成模型,通过所述对话生成模型输出回复语句。2.根据权利要求1所述的对话生成方法,其特征在于,所述对话生成模型包括编码器和解码器,将所述原始语句信息和所述扩展信息输入对话生成模型,通过所述对话生成模型输出回复语句,包括:将所述原始语句信息和所述扩展信息输入编码器,通过所述编码器分别生成原始语句向量和扩展语句向量;将所述原始语句向量和所述扩展语句向量输入解码器,通过所述解码器生成回复语句。3.根据权利要求2所述的对话生成方法,其特征在于,将所述原始语句向量和所述扩展语句向量输入解码器,通过所述解码器生成回复语句,包括:将所述原始语句向量和所述扩展语句向量联合作为所述解码器的初始向量;将所述初始向量作为所述解码器的初始输入,逐个生成所述回复语句的每个字。4.根据权利要求2所述的对话生成方法,其特征在于,将所述原始语句向量和所述扩展语句向量输入解码器,通过所述解码器生成回复语句,包括:将所述原始语句向量和所述扩展语句向量联合作为所述解码器的初始向量;根据初始向量生成回复语句输出第一个字,并依次将上一个字和扩展向量作为下一个字的初始向量,逐个生成所述回复语句的每个字。5.根据权利要求1至4中任一项所述的对话生成方法,其特征在于,还包括:采用训练数据生成所述对话生成模型,所述对话生成模型是基于循环神经网络构建的。6.一种对话生成装置,其特征在于,包括:获取模块,用于获取输入的原始语句信息;扩展模块,用于根据所述原始语句信息在搜索行为数据中进行查询,获得所述原始语句信息的扩展信...

【专利技术属性】
技术研发人员:连荣忠彭金华马宗阳姜迪何径舟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1