回复信息生成方法、装置及存储介质制造方法及图纸

技术编号:22166849 阅读:14 留言:0更新日期:2019-09-21 10:33
本发明专利技术实施例公开了一种回复信息生成方法、装置及存储介质,属于计算机技术领域。该方法包括:基于主题模型,获取历史对话记录的第一编码,第一编码用于表示历史对话记录属于多个预设主题的概率;对历史对话记录进行编码,得到历史对话记录的第二编码,第二编码用于对历史对话记录的含义进行描述;对当前输入的问题信息进行编码,得到问题信息的第三编码,第三编码用于对问题信息的含义进行描述;对第一编码、第二编码和第三编码进行解码,得到问题信息的回复信息。生成回复信息的过程中综合考虑了历史对话记录、历史对话记录所属的主题以及当前输入的问题信息,保证了回复信息所属的主题与历史对话记录所属的主题一致,且实现了上下文的一致性。

Method, device and storage medium of reply information generation

【技术实现步骤摘要】
回复信息生成方法、装置及存储介质
本专利技术实施例涉及计算机
,特别涉及一种回复信息生成方法、装置及存储介质。
技术介绍
随着计算机技术和自然语言处理技术的快速发展,智能对话机器人、智能客服应用等智能问答系统开始出现,智能问答系统能够根据用户输入的问题信息生成回复信息,从而帮助用户解决诸多问题。目前,如何提高智能问答系统的性能已成为热门的研究方向。智能问答系统中,可以预先训练得到信息回复模型,该信息回复模型用于生成问题信息的回复信息,则用户输入问题信息时,对该问题信息进行编码,基于该信息回复模型,对该问题信息的编码进行解码,得到该问题信息的回复信息,展示给用户,从而模拟了智能问答系统与用户之间进行对话的场景。上述方案中的回复信息根据用户输入的问题信息生成,但未考虑该问题信息之前的其他信息,因此无法保证上下文一致,导致回复效果欠佳,无法满足用户的需求。
技术实现思路
本专利技术实施例提供了一种回复信息生成方法、装置及存储介质,可以解决相关技术存在的无法保证上下文一致,导致回复效果欠佳,无法满足用户的需求的问题。所述技术方案如下:一方面,提供了一种回复信息生成方法,所述方法包括:基于主题模型,获取历史对话记录的第一编码,所述第一编码用于表示所述历史对话记录属于多个预设主题的概率;对所述历史对话记录进行编码,得到所述历史对话记录的第二编码,所述第二编码用于对所述历史对话记录的含义进行描述;对当前输入的问题信息进行编码,得到所述问题信息的第三编码,所述第三编码用于对所述问题信息的含义进行描述;对所述第一编码、所述第二编码和所述第三编码进行解码,得到所述问题信息的回复信息。另一方面,提供了一种回复信息生成装置,所述装置包括:第一编码模块,用于基于主题模型,获取历史对话记录的第一编码,所述第一编码用于表示所述历史对话记录属于多个预设主题的概率;第二编码模块,用于对所述历史对话记录进行编码,得到所述历史对话记录的第二编码,所述第二编码用于对所述历史对话记录的含义进行描述;第三编码模块,用于对当前输入的问题信息进行编码,得到所述问题信息的第三编码,所述第三编码用于对所述问题信息的含义进行描述;解码模块,用于对所述第一编码、所述第二编码和所述第三编码进行解码,得到所述问题信息的回复信息。另一方面,提供了一种用于生成回复信息的装置,所述装置包括:处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现如所述的回复信息生成方法中所执行的操作。另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由处理器加载并执行以实现如所述的回复信息生成方法中所执行的操作。本专利技术实施例提供的回复信息生成方法、装置及存储介质,通过基于主题模型,获取历史对话记录的第一编码,第一编码用于表示历史对话记录属于多个预设主题的概率;对历史对话记录进行编码,得到历史对话记录的第二编码,第二编码用于对历史对话记录的含义进行描述;对当前输入的问题信息进行编码,得到问题信息的第三编码,第三编码用于对问题信息的含义进行描述;对第一编码、第二编码和第三编码进行解码,得到问题信息的回复信息。生成回复信息的过程中综合考虑了历史对话记录、历史对话记录所属的主题以及当前输入的问题信息,回复信息所属的主题与历史对话记录所属的主题一致,保证了上下文一致,提高了回复效果,满足了用户的需求。并且,在确定问题信息中的词汇对应的回复词汇时,会考虑历史对话记录所属的主题和前一个词汇的影响,保证了回复词汇所属的主题与历史对话记录所属的主题一致,而且与前一个词汇含义连贯,实现了上下文的一致性。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种实施环境的示意图;图2本专利技术实施例提供的一种回复信息生成方法的流程图;图3是本专利技术实施例提供的一种生成回复信息的流程图;图4是本专利技术实施例提供的一种生成回复词汇的流程图;图5是本专利技术实施例提供的一种基于拷贝生成网络模型的解码流程图;图6是本专利技术实施例提供的一种问题信息和回复信息的示例性示意图;图7是本专利技术实施例提供的一种对话信息的示例性示意图;图8是本专利技术实施例提供的一种对话信息的示例性示意图;图9是本专利技术实施例提供的一种回复信息生成装置的结构示意图;图10是本专利技术实施例提供的一种终端的结构示意图;图11是本专利技术实施例提供的一种服务器的结构框图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。本专利技术实施例提供的回复信息生成方法应用于智能设备,该智能设备用于根据当前输入的问题信息生成回复信息,实现与用户之间的智能对话。其中,该智能设备可以包括服务器、终端、智能音箱或者智能对话机器人等具有处理功能的设备。该终端可以为手机、平板电脑以及计算机等多种类型的终端,该服务器可以为一台服务器,或者由若干台服务器组成的服务器集群,或者是一个云计算服务中心。在一种可能实现方式中,本专利技术实施例提供的方法应用于终端中,终端获取到当前输入的问题信息时,采用本专利技术实施例提供的方法生成问题信息的回复信息。在另一种可能实现方式中,本专利技术实施例提供的方法应用于服务器中,服务器获取到当前输入的问题信息时,采用本专利技术实施例提供的方法生成问题信息的回复信息。在另一种可能实现方式中,图1是本专利技术实施例提供的一种实施环境的示意图,参见图1,该实施环境包括:终端101和服务器102,终端101与服务器102通过网络连接。用户在终端101上输入问题信息,终端101获取该问题信息,发送给服务器102,服务器102接收到问题信息时,生成问题信息的回复信息,发送给终端101,则终端101将回复信息展示给用户。本专利技术实施例应用于智能对话的场景下,在此场景下需要根据当前输入的问题信息给出相应的回复信息。例如,终端安装有智能客服应用,用户将问题信息以文本消息的形式输入至智能客服应用,智能客服应用获取到该问题信息后,采用本专利技术实施例提供的方法,生成该问题信息的回复信息,展示给用户,实现了用户与智能客服应用进行对话的效果。又如,用户将问题信息以语音消息的形式输入至智能对话机器人,智能对话机器人获取到该问题信息后,采用本专利技术实施例提供的方法,生成该问题信息的回复信息,播放给用户,实现了用户与智能对话机器人进行对话的效果。图2是本专利技术实施例提供的一种回复信息生成方法的流程图。本专利技术实施例的执行主体为智能设备,该智能设备为上述实施例中的终端、服务器或者为其他类型的智能设备。参见图2,该方法包括:201、基于主题模型,获取历史对话记录的第一编码。本专利技术实施例中,智能设备可以根据当前输入的问题信息生成回复信息,实现与用户之间的对话,该问题信息和回复信息均可称为对话信息,且对话过程中还可以生成对话记录,该对话记录中包括问题信息和回复信息,除本文档来自技高网...

【技术保护点】
1.一种回复信息生成方法,其特征在于,所述方法包括:基于主题模型,获取历史对话记录的第一编码,所述第一编码用于表示所述历史对话记录属于多个预设主题的概率;对所述历史对话记录进行编码,得到所述历史对话记录的第二编码,所述第二编码用于对所述历史对话记录的含义进行描述;对当前输入的问题信息进行编码,得到所述问题信息的第三编码,所述第三编码用于对所述问题信息的含义进行描述;对所述第一编码、所述第二编码和所述第三编码进行解码,得到所述问题信息的回复信息。

【技术特征摘要】
1.一种回复信息生成方法,其特征在于,所述方法包括:基于主题模型,获取历史对话记录的第一编码,所述第一编码用于表示所述历史对话记录属于多个预设主题的概率;对所述历史对话记录进行编码,得到所述历史对话记录的第二编码,所述第二编码用于对所述历史对话记录的含义进行描述;对当前输入的问题信息进行编码,得到所述问题信息的第三编码,所述第三编码用于对所述问题信息的含义进行描述;对所述第一编码、所述第二编码和所述第三编码进行解码,得到所述问题信息的回复信息。2.根据权利要求1所述的方法,其特征在于,所述历史对话记录包括多条历史对话信息;所述对所述历史对话记录进行编码,得到所述历史对话记录的第二编码,包括:对于所述多条历史对话信息中的第一条历史对话信息,根据所述历史对话信息获取所述历史对话信息的隐向量;对于所述第一条历史对话信息之后的每条历史对话信息,根据所述历史对话信息和所述历史对话信息的前一条历史对话信息的隐向量,获取所述历史对话信息的隐向量;根据所述多条历史对话信息的隐向量,获取所述第二编码。3.根据权利要求1所述的方法,其特征在于,所述问题信息包括多个词汇,所述对当前输入的问题信息进行编码,得到所述问题信息的第三编码,包括:对于所述多个词汇中的第一个词汇,根据所述词汇获取所述词汇的隐向量;对于所述第一个词汇之后的每个词汇,根据所述词汇和所述词汇的前一个词汇的隐向量,获取所述词汇的隐向量;根据所述多个词汇的隐向量,获取所述第三编码。4.根据权利要求1所述的方法,其特征在于,所述问题信息包括多个词汇,所述对所述第一编码、所述第二编码和所述第三编码进行解码,得到所述问题信息的回复信息,包括:对于所述多个词汇中的第一个词汇,基于编码单元,对所述第一编码和所述第三编码进行处理,得到隐向量;基于注意力单元,对所述隐向量和所述第二编码进行处理,得到所述词汇对应的回复词汇标识,根据所述回复词汇标识确定所述词汇对应的回复词汇;对于所述第一个词汇之后的每个词汇,基于所述编码单元,对所述第一编码、所述第三编码、所述词汇的前一个词汇对应的回复词汇标识和所述前一个词汇对应的回复词汇进行处理,得到隐向量;基于所述注意力单元,对所述隐向量和所述第二编码进行处理,得到所述词汇对应的回复词汇标识,根据所述回复词汇标识确定所述词汇对应的回复词汇;根据所述多个词汇对应的回复词汇,生成所述回复信息。5.根据权利要求4所述的方法,其特征在于,所述根据所述多个词汇对应的回复词汇,生成所述回复信息,包括:按照所述多个词汇的先后顺序,将所述多个词汇对应的回复词汇进行连接,得到所述回复信息。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:构建初始的主题模型,所述主题模型包括多个预设主题;获取多个样本对话信息以及每个样本对话信息所属的主题;根据所述多个样本对话信息以及所述每个样本对话信息所属的主题,对所述主题模型进行训练。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:构建初始的解码模型;获取多个样本问题信息,以及每个样本问题信息的样本编码和回复词汇标识,所述样本编码中包括第四编码、第五编码和第六编码,所述第四编码用于表示所述样本问题信息的历史对话记录属于所述多个预设主题的概率,所述第五编码用于对所述历史对话记录的含义进行描述,所述第六编码用于对所述样本问题信息的含义进行描述;根据所述多个样本问题信息的样本编码和回复词汇标识,对所述解码模型进行训练。8.根据权利要求7所述的方法,其特征在于,所述样本问题信息包括多个词汇;所述根据所述多个样本问题信息的样本编码和回复词汇标识,对所述解码模型进行训练,包括:对于所述多个词汇中的第一个词汇,基于编码单元,对所述第四编码和所述第六编码进行处理,得到隐向量;基于注意力单元,对所述隐向量和所述第五编码进行处理,得到所述词汇对应的回复...

【专利技术属性】
技术研发人员:缪畅宇
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1