【技术实现步骤摘要】
回复信息生成方法、装置及存储介质
本专利技术实施例涉及计算机
,特别涉及一种回复信息生成方法、装置及存储介质。
技术介绍
随着计算机技术和自然语言处理技术的快速发展,智能对话机器人、智能客服应用等智能问答系统开始出现,智能问答系统能够根据用户输入的问题信息生成回复信息,从而帮助用户解决诸多问题。目前,如何提高智能问答系统的性能已成为热门的研究方向。智能问答系统中,可以预先训练得到信息回复模型,该信息回复模型用于生成问题信息的回复信息,则用户输入问题信息时,对该问题信息进行编码,基于该信息回复模型,对该问题信息的编码进行解码,得到该问题信息的回复信息,展示给用户,从而模拟了智能问答系统与用户之间进行对话的场景。上述方案中的回复信息根据用户输入的问题信息生成,但未考虑该问题信息之前的其他信息,因此无法保证上下文一致,导致回复效果欠佳,无法满足用户的需求。
技术实现思路
本专利技术实施例提供了一种回复信息生成方法、装置及存储介质,可以解决相关技术存在的无法保证上下文一致,导致回复效果欠佳,无法满足用户的需求的问题。所述技术方案如下:一方面,提供了一种回复信息生成方法,所述方法包括:基于主题模型,获取历史对话记录的第一编码,所述第一编码用于表示所述历史对话记录属于多个预设主题的概率;对所述历史对话记录进行编码,得到所述历史对话记录的第二编码,所述第二编码用于对所述历史对话记录的含义进行描述;对当前输入的问题信息进行编码,得到所述问题信息的第三编码,所述第三编码用于对所述问题信息的含义进行描述;对所述第一编码、所述第二编码和所述第三编码进行解码,得到所述问题信息的 ...
【技术保护点】
1.一种回复信息生成方法,其特征在于,所述方法包括:基于主题模型,获取历史对话记录的第一编码,所述第一编码用于表示所述历史对话记录属于多个预设主题的概率;对所述历史对话记录进行编码,得到所述历史对话记录的第二编码,所述第二编码用于对所述历史对话记录的含义进行描述;对当前输入的问题信息进行编码,得到所述问题信息的第三编码,所述第三编码用于对所述问题信息的含义进行描述;对所述第一编码、所述第二编码和所述第三编码进行解码,得到所述问题信息的回复信息。
【技术特征摘要】
1.一种回复信息生成方法,其特征在于,所述方法包括:基于主题模型,获取历史对话记录的第一编码,所述第一编码用于表示所述历史对话记录属于多个预设主题的概率;对所述历史对话记录进行编码,得到所述历史对话记录的第二编码,所述第二编码用于对所述历史对话记录的含义进行描述;对当前输入的问题信息进行编码,得到所述问题信息的第三编码,所述第三编码用于对所述问题信息的含义进行描述;对所述第一编码、所述第二编码和所述第三编码进行解码,得到所述问题信息的回复信息。2.根据权利要求1所述的方法,其特征在于,所述历史对话记录包括多条历史对话信息;所述对所述历史对话记录进行编码,得到所述历史对话记录的第二编码,包括:对于所述多条历史对话信息中的第一条历史对话信息,根据所述历史对话信息获取所述历史对话信息的隐向量;对于所述第一条历史对话信息之后的每条历史对话信息,根据所述历史对话信息和所述历史对话信息的前一条历史对话信息的隐向量,获取所述历史对话信息的隐向量;根据所述多条历史对话信息的隐向量,获取所述第二编码。3.根据权利要求1所述的方法,其特征在于,所述问题信息包括多个词汇,所述对当前输入的问题信息进行编码,得到所述问题信息的第三编码,包括:对于所述多个词汇中的第一个词汇,根据所述词汇获取所述词汇的隐向量;对于所述第一个词汇之后的每个词汇,根据所述词汇和所述词汇的前一个词汇的隐向量,获取所述词汇的隐向量;根据所述多个词汇的隐向量,获取所述第三编码。4.根据权利要求1所述的方法,其特征在于,所述问题信息包括多个词汇,所述对所述第一编码、所述第二编码和所述第三编码进行解码,得到所述问题信息的回复信息,包括:对于所述多个词汇中的第一个词汇,基于编码单元,对所述第一编码和所述第三编码进行处理,得到隐向量;基于注意力单元,对所述隐向量和所述第二编码进行处理,得到所述词汇对应的回复词汇标识,根据所述回复词汇标识确定所述词汇对应的回复词汇;对于所述第一个词汇之后的每个词汇,基于所述编码单元,对所述第一编码、所述第三编码、所述词汇的前一个词汇对应的回复词汇标识和所述前一个词汇对应的回复词汇进行处理,得到隐向量;基于所述注意力单元,对所述隐向量和所述第二编码进行处理,得到所述词汇对应的回复词汇标识,根据所述回复词汇标识确定所述词汇对应的回复词汇;根据所述多个词汇对应的回复词汇,生成所述回复信息。5.根据权利要求4所述的方法,其特征在于,所述根据所述多个词汇对应的回复词汇,生成所述回复信息,包括:按照所述多个词汇的先后顺序,将所述多个词汇对应的回复词汇进行连接,得到所述回复信息。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:构建初始的主题模型,所述主题模型包括多个预设主题;获取多个样本对话信息以及每个样本对话信息所属的主题;根据所述多个样本对话信息以及所述每个样本对话信息所属的主题,对所述主题模型进行训练。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:构建初始的解码模型;获取多个样本问题信息,以及每个样本问题信息的样本编码和回复词汇标识,所述样本编码中包括第四编码、第五编码和第六编码,所述第四编码用于表示所述样本问题信息的历史对话记录属于所述多个预设主题的概率,所述第五编码用于对所述历史对话记录的含义进行描述,所述第六编码用于对所述样本问题信息的含义进行描述;根据所述多个样本问题信息的样本编码和回复词汇标识,对所述解码模型进行训练。8.根据权利要求7所述的方法,其特征在于,所述样本问题信息包括多个词汇;所述根据所述多个样本问题信息的样本编码和回复词汇标识,对所述解码模型进行训练,包括:对于所述多个词汇中的第一个词汇,基于编码单元,对所述第四编码和所述第六编码进行处理,得到隐向量;基于注意力单元,对所述隐向量和所述第五编码进行处理,得到所述词汇对应的回复...
【专利技术属性】
技术研发人员:缪畅宇,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。