人机对话的回复生成方法和装置制造方法及图纸

技术编号:18018991 阅读:47 留言:0更新日期:2018-05-23 05:13
本发明专利技术提出一种人机对话的回复生成方法和装置,其中,方法包括:获取人机对话中的用户消息,生成用于回复用户消息的多个关键词,利用编码器对多个关键词进行编码,得到多个关键词的第一隐状态,根据多个关键词的第一隐状态,利用解码器顺序生成回复消息中各文本位置对应的多个第二隐状态,根据每一个第二隐状态进行采样,得到处于第二隐状态对应文本位置上的词汇,根据各词汇所处的文本位置,生成回复消息。通过获取用户消息生成多个关键词,并对关键词进行编码和解码处理,并通过采样获取关键词对应的文本词汇,进而生成回复消息,解决了现有技术中需要依赖特定的模板,生成的回复消息适用性、相关性和多样性较差,无法满足用户需求的问题。

【技术实现步骤摘要】
人机对话的回复生成方法和装置
本专利技术涉及人工智能
,尤其涉及一种人机对话的回复生成方法和装置。
技术介绍
自然语言处理技术的发展,使得通过人机对话系统实现了人与计算机之间可用自然语言进行有效通信,而回复生成是人机对话系统的一个重要组成部分,在人机对话系统中,系统根据用户的消息,生成一句自然语言作为系统回复。相关技术中,人机对话系统中的回复生成技术主要采用模板方法,还有基于深度学习的端到端生成技术,根据接收到的用户的消息生成相应的自然语言的回复,但这两种方式系统适用性差,且得到的回复语言的流畅性、相关性和多样性均较差,都无法满足用户的需求。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种人机对话的回复生成方法和装置,通过用户消息生成多个关键词,并对关键词进行编码和解码处理,并通过采样获取关键词对应的文本词汇,进而生成回复消息,实现了不需要构建特征工程,适用于开放域的对话系统,解决了现有技术中需要依赖特定的模板,系统适用性差,生成的回复消息适用性、相关性和多样性也较差,无法满足用户需求的问题。本专利技术的第二个目的在于提出一种人机对话的回复生成装置。本专利技术的第三个目的在于提出一种计算机设备。本专利技术的第四个目的在于提出一种非临时性计算机可读存储介质。本专利技术的第五个目的在于提出一种计算机程序产品。为达上述目的,本专利技术第一方面实施例提出了一种人机对话的回复生成方法,包括:获取人机对话中的用户消息;根据用户消息,生成用于回复所述用户消息的多个关键词;利用编码器对所述多个关键词进行编码,得到所述多个关键词的第一隐状态;根据所述多个关键词的第一隐状态,利用解码器顺序生成回复消息中各文本位置对应的多个第二隐状态;其中,若当前文本位置不为首个文本位置,当前文本位置对应的第二隐状态,是根据前一个文本位置对应的第二隐状态和所述多个关键词的第一隐状态,计算得到当前文本位置的注意力分布后,根据所述注意力分布对所述多个关键词的第一隐状态进行加权平均得到当前文本位置的上下文向量,根据所述前一个文本位置对应的第二隐状态和所述上下文向量,生成当前文本位置对应的第二隐状态;根据每一个第二隐状态进行采样,得到处于所述第二隐状态对应文本位置上的词汇;根据各词汇,以及各词汇所处的文本位置,生成回复消息。本专利技术实施例的人机对话的回复生成方法中,获取人机对话中的用户消息,根据用户消息,生成用于回复用户消息的多个关键词,利用编码器对多个关键词进行编码,得到多个关键词的第一隐状态,根据多个关键词的第一隐状态,利用解码器顺序生成回复消息中各文本位置对应的多个第二隐状态,根据每一个第二隐状态进行采样,得到处于第二隐状态对应文本位置上的词汇,根据各词汇,以及各词汇所处的文本位置,生成回复消息。通过用户消息生成多个关键词,并对关键词进行编码和解码处理,并通过采样获取关键词对应的文本词汇,进而生成回复消息,实现了不需要构建特征工程,适用于开放域的对话系统,解决了现有技术中需要依赖特定的模板,系统适用性差,生成的回复消息适用性、相关性和多样性也较差,无法满足用户需求的问题。为达上述目的,本专利技术第二方面实施例提出了一种人机对话的回复生成装置,包括:获取模块,用于获取人机对话中的用户消息;第一生成模块,用于根据用户消息,生成用于回复所述用户消息的多个关键词;编码模块,用于利用编码器对所述多个关键词进行编码,得到所述多个关键词的第一隐状态;解码模块,用于根据所述多个关键词的第一隐状态,利用解码器顺序生成回复消息中各文本位置对应的多个第二隐状态;其中,若当前文本位置不为首个文本位置,当前文本位置对应的第二隐状态,是根据前一个文本位置对应的第二隐状态和所述多个关键词的第一隐状态,计算得到当前文本位置的注意力分布后,根据所述注意力分布对所述多个关键词的第一隐状态进行加权平均得到当前文本位置的上下文向量,根据所述前一个文本位置对应的第二隐状态和所述上下文向量,生成当前文本位置对应的第二隐状态;第二生成模块,用于根据每一个第二隐状态进行采样,得到处于所述第二隐状态对应文本位置上的词汇;根据各词汇,以及各词汇所处的文本位置,生成回复消息。本专利技术实施例的人机对话的回复生成装置中,获取模块用于获取人机对话中的用户消息,第一生成模块用于根据用户消息,生成用于回复用户消息的多个关键词,编码模块用于利用编码器对多个关键词进行编码,得到多个关键词的第一隐状态,解码模块用于根据多个关键词的第一隐状态,利用解码器顺序生成回复消息中各文本位置对应的多个第二隐状态,第二生成模块用于根据每一个第二隐状态进行采样,得到处于第二隐状态对应文本位置上的词汇,根据各词汇,以及各词汇所处的文本位置,生成回复消息。通过用户消息生成多个关键词,并对关键词进行编码和解码处理,并通过采样获取关键词对应的文本词汇,进而生成回复消息,实现了不需要构建特征工程,适用于开放域的对话系统,解决了现有技术中需要依赖特定的模板,系统适用性差,生成的回复消息适用性、相关性和多样性也较差,无法满足用户需求的问题。为达上述目的,本专利技术第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如第一方面所述的人机对话的回复生成方法。为了实现上述目的,本专利技术第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的人机对话的回复生成方法。为了实现上述目的,本专利技术第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令被处理器执行时,实现如第一方面所述的人机对话的回复生成方法。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本专利技术实施例所提供的一种人机对话的回复生成方法的流程示意图;图2为本专利技术实施例所提供的另一种人机对话的回复生成方法的流程示意图;图3为本专利技术实施例所提供的基于关键词的文本生成系统的框图;图4为本专利技术实施例提供的一种人机对话的回复生成装置的结构示意图;图5为本专利技术实施例所提供的另一种人机对话的回复生成装置的结构示意图;以及图6示出了适于用来实现本申请实施方式的示例性计算机设备的框图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。下面参考附图描述本专利技术实施例的人机对话的回复生成方法和装置。现有技术中,人机对话系统中根据人机对话中的用户消息生成回复消息,而生成的回复消息适用性较差,同时回复消息的相关性和多样性也较差,无法满足用户的需求。目前,人机对话系统中的回复生成主要是通过以下2种方案实现的:方案1:模板方法:需要通过人工预先定义模板和规则,将自然语言理解和对话管理模块的输出转换为自然语言。但是,这种方式,模板的构造依赖于人工编写的特征,耗费大量的人力和成本,而构造的模板通常只本文档来自技高网...
人机对话的回复生成方法和装置

【技术保护点】
一种人机对话的回复生成方法,其特征在于,包括以下步骤:获取人机对话中的用户消息;根据用户消息,生成用于回复所述用户消息的多个关键词;利用编码器对所述多个关键词进行编码,得到所述多个关键词的第一隐状态;根据所述多个关键词的第一隐状态,利用解码器顺序生成回复消息中各文本位置对应的多个第二隐状态;其中,若当前文本位置不为首个文本位置,当前文本位置对应的第二隐状态,是根据前一个文本位置对应的第二隐状态和所述多个关键词的第一隐状态,计算得到当前文本位置的注意力分布后,根据所述注意力分布对所述多个关键词的第一隐状态进行加权平均得到当前文本位置的上下文向量,根据所述前一个文本位置对应的第二隐状态和所述上下文向量,生成当前文本位置对应的第二隐状态;根据每一个第二隐状态进行采样,得到处于所述第二隐状态对应文本位置上的词汇;根据各词汇,以及各词汇所处的文本位置,生成回复消息。

【技术特征摘要】
1.一种人机对话的回复生成方法,其特征在于,包括以下步骤:获取人机对话中的用户消息;根据用户消息,生成用于回复所述用户消息的多个关键词;利用编码器对所述多个关键词进行编码,得到所述多个关键词的第一隐状态;根据所述多个关键词的第一隐状态,利用解码器顺序生成回复消息中各文本位置对应的多个第二隐状态;其中,若当前文本位置不为首个文本位置,当前文本位置对应的第二隐状态,是根据前一个文本位置对应的第二隐状态和所述多个关键词的第一隐状态,计算得到当前文本位置的注意力分布后,根据所述注意力分布对所述多个关键词的第一隐状态进行加权平均得到当前文本位置的上下文向量,根据所述前一个文本位置对应的第二隐状态和所述上下文向量,生成当前文本位置对应的第二隐状态;根据每一个第二隐状态进行采样,得到处于所述第二隐状态对应文本位置上的词汇;根据各词汇,以及各词汇所处的文本位置,生成回复消息。2.根据权利要求1所述的回复方法,其特征在于,所述根据每一个第二隐状态进行采样,得到处于所述第二隐状态对应文本位置上的词汇,包括:针对第n个文本位置对应的第二隐状态Sn,根据Sn,计算得到在第n个文本位置上的词库词汇分布根据第n个文本位置的上下文向量Cn计算得到在第n个文本位置上符合所述词库词汇分布的概率根据注意力分布an,计算得到在第n个文本位置上的关键词分布根据所述概率对所述词库词汇分布和所述关键词分布进行加权计算,得到在第n个文本位置上词汇预测分布on;根据所述词汇预测分布on,在所述词库中采样,确定在第n个文本位置上的词汇。3.根据权利要求2所述的回复方法,其特征在于,所述根据所述概率对所述词库词汇分布和所述关键词分布进行加权计算,得到在第n个文本位置上词汇预测分布on,包括:将所述概率所述词库词汇分布和所述关键词分布代入公式计算得到在第n个文本位置上的词汇预测分布on。4.根据权利要求1所述的回复方法,其特征在于,所述根据所述多个关键词的第一隐状态,利用解码器顺序生成回复消息中各文本位置对应的多个第二隐状态,包括:若当前文本位置为所述回复消息的首个文本位置,将所述多个关键词编码得到的第一隐状态输入所述解码器,得到当前文本位置对应的第二隐状态。5.根据权利要求1所述的回复方法,其特征在于,...

【专利技术属性】
技术研发人员:陈潮涛李辰姜迪吴华何径舟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1