对话生成方法、装置、设备及计算机可读介质制造方法及图纸

技术编号:19778449 阅读:32 留言:0更新日期:2018-12-15 11:21
本发明专利技术提出一种对话生成方法、装置、设备及计算机可读介质。所述对话生成方法,包括:获取输入的原始语句信息;根据所述原始语句信息在搜索行为数据中进行查询,获得所述原始语句信息的扩展信息;将所述原始语句信息和所述扩展信息输入对话生成模型,通过所述对话生成模型输出回复语句。本发明专利技术实施例可以提高计算效率,降低计算时间消耗,另外通过对输入的语句信息进行扩展,可以增加回复生成的准确性。

【技术实现步骤摘要】
对话生成方法、装置、设备及计算机可读介质
本专利技术涉及人工智能领域,尤其涉及一种基于检索日记的对话生成方法及装置、设备和计算机可读介质。
技术介绍
通用对话系统作为人工智能的重要场景,得到越来越多的关注,典型的工业界应用包括:聊天机器人、手机助手等。而在通用对话系统中,进行对话的生成是重要的一个环境,目前主流的方法包括两种:检索式和自然语言生成。检索式的方法是通过用户输入的句子在语料中进行检索,找到一些相关的回复,效果很受语料的限制,对应语料中没有相关的句子则无法回复用户。因此基于自然语言生成的方式越来越受到重视,使用的是端到端(end2end)的框架,最常用的为序列到序列(seq2seq,sequencetosequence)。但是使用自然语言生成的方式面临着生成安全回复的重要问题,会生成一些没有信息含量与上文没有关联的通用回复,例如:『我不知道啊』,『不错不错』。在实际应用中生成这些回复会严重影响用户的体验。为了解决生成没有信息含量和无关联回复的问题,现有技术提出了在生成的过程中加入关键词进行辅助,或者使用最大交互信息(MaximumMutualInformation,MMI)本文档来自技高网...

【技术保护点】
1.一种对话生成方法,其特征在于,包括:获取输入的原始语句信息;根据所述原始语句信息在搜索行为数据中进行查询,获得所述原始语句信息的扩展信息;将所述原始语句信息和所述扩展信息输入对话生成模型,通过所述对话生成模型输出回复语句。

【技术特征摘要】
1.一种对话生成方法,其特征在于,包括:获取输入的原始语句信息;根据所述原始语句信息在搜索行为数据中进行查询,获得所述原始语句信息的扩展信息;将所述原始语句信息和所述扩展信息输入对话生成模型,通过所述对话生成模型输出回复语句。2.根据权利要求1所述的对话生成方法,其特征在于,所述对话生成模型包括编码器和解码器,将所述原始语句信息和所述扩展信息输入对话生成模型,通过所述对话生成模型输出回复语句,包括:将所述原始语句信息和所述扩展信息输入编码器,通过所述编码器分别生成原始语句向量和扩展语句向量;将所述原始语句向量和所述扩展语句向量输入解码器,通过所述解码器生成回复语句。3.根据权利要求2所述的对话生成方法,其特征在于,将所述原始语句向量和所述扩展语句向量输入解码器,通过所述解码器生成回复语句,包括:将所述原始语句向量和所述扩展语句向量联合作为所述解码器的初始向量;将所述初始向量作为所述解码器的初始输入,逐个生成所述回复语句的每个字。4.根据权利要求2所述的对话生成方法,其特征在于,将所述原始语句向量和所述扩展语句向量输入解码器,通过所述解码器生成回复语句,包括:将所述原始语句向量和所述扩展语句向量联合作为所述解码器的初始向量;根据初始向量生成回复语句输出第一个字,并依次将上一个字和扩展向量作为下一个字的初始向量,逐个生成所述回复语句的每个字。5.根据权利要求1至4中任一项所述的对话生成方法,其特征在于,还包括:采用训练数据生成所述对话生成模型,所述对话生成模型是基于循环神经网络构建的。6.一种对话生成装置,其特征在于,包括:获取模块,用于获取输入的原始语句信息;扩展模块,用于根据所述原始语句信息在搜索行为数据中进行查询,获得所述原始语句信息的扩展信...

【专利技术属性】
技术研发人员:连荣忠彭金华马宗阳姜迪何径舟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1