基于关键词生成回复语句的方法及装置制造方法及图纸

技术编号:20160502 阅读:37 留言:0更新日期:2019-01-19 00:13
本发明专利技术实施例公开了一种基于关键词生成回复语句的方法及装置,涉及自然语言处理技术领域,提高了人机对话系统生成回复语句的内容丰富度。本发明专利技术实施例主要技术方案为:获取用户输入的提问语句,并生成所述提问语句对应的多个词向量;使用编码器对多个所述词向量进行编码处理,以生成所述提问语句对应的隐藏层状态向量;确定所述提问语句对应的关键词的词向量;使用解码器对所述关键词的词向量以及所述隐藏层状态向量进行解码处理,以生成所述提问语句对应的回复语句。本发明专利技术实施例主要应用于人机对话系统生成回复语句。

【技术实现步骤摘要】
基于关键词生成回复语句的方法及装置
本专利技术实施例涉及自然语言处理
,尤其涉及一种基于关键词生成回复语句的方法及装置。
技术介绍
随着人工智能技术的不断发展,基于Seq2Seq(SequencetoSequence,序列到序列)模型开发的人机对话系统逐渐受到人们的关注。其中,Seq2Seq模型由编码器和解码器组成,当人机对话系统接收到终端用户输入的提问语句后,人机对话系统首先使用编码器将提问语句编码为一个状态向量,然后使用解码器对该状态向量进行解码处理,从而生成回复语句。专利技术人在实现本专利技术的过程中,发现现有技术中存在以下技术问题,由于,在对Seq2Seq模型进行训练时,通常采用最大似然法进行训练,因此,会导致出现频率较高的回复语句更容易被生成的情况发生,从而使得人机对话系统很大概率会生成“不知道”、“好的”等无实质意义的通用回复语句,进而导致人机对话无法再进行下去,使得终端用户的用户体验较差。
技术实现思路
有鉴于此,本专利技术实施例提供一种基于关键词生成回复语句的方法及装置,主要目的在于提高人机对话系统生成回复语句的内容丰富度。为了达到上述目的,本专利技术实施例主要提供本文档来自技高网...

【技术保护点】
1.一种基于关键词生成回复语句的方法,其特征在于,所述方法包括:获取用户输入的提问语句,并生成所述提问语句对应的多个词向量;使用编码器对多个所述词向量进行编码处理,以生成所述提问语句对应的隐藏层状态向量;确定所述提问语句对应的关键词的词向量;使用解码器对所述关键词的词向量以及所述隐藏层状态向量进行解码处理,以生成所述提问语句对应的回复语句。

【技术特征摘要】
1.一种基于关键词生成回复语句的方法,其特征在于,所述方法包括:获取用户输入的提问语句,并生成所述提问语句对应的多个词向量;使用编码器对多个所述词向量进行编码处理,以生成所述提问语句对应的隐藏层状态向量;确定所述提问语句对应的关键词的词向量;使用解码器对所述关键词的词向量以及所述隐藏层状态向量进行解码处理,以生成所述提问语句对应的回复语句。2.根据权利要求1所述的方法,其特征在于,所述编码器包含第一LSTM隐藏层和第二LSTM隐藏层;所述第一LSTM隐藏层包含多个第一LSTM神经单元,所述第二LSTM隐藏层包含多个第二LSTM神经单元;所述使用编码器对多个所述词向量进行编码处理,以生成所述提问语句对应的隐藏层状态向量,包括:根据所述提问语句对多个所述词向量进行排序;将排序后的多个所述词向量依次输入所述编码器,以便所述编码器确定每个所述词向量对应的第一LSTM神经单元以及第二LSTM神经单元;通过所述第一LSTM神经单元将其对应的词向量以及前一第一LSTM神经单元的第一隐藏层状态向量代入第一非线性激活函数,以计算所述第一LSTM神经单元对应的第一隐藏层状态向量,其中,排序后的多个所述词向量中的第一个词向量对应的第一LSTM神经单元的前一第一LSTM神经单元的第一隐藏层状态向量的取值为空向量;通过所述第二LSTM神经单元将其对应的第一LSTM神经单元的第一隐藏层状态向量、前一第二LSTM神经单元的第二隐藏层状态向量以及空向量代入第二非线性激活函数,以计算所述第二LSTM神经单元对应的第二隐藏层状态向量,其中,排序后的多个所述词向量中的第一个词向量对应的第二LSTM神经单元的前一第二LSTM神经单元的第二隐藏层状态向量的取值为空向量;将排序后的多个所述词向量中的最后一个词向量对应的第一LSTM神经单元的第一隐藏层状态向量和第二LSTM神经单元的第二隐藏层状态向量确定为所述提问语句对应的隐藏层状态向量。3.根据权利要求2所述的方法,其特征在于,所述解码器包含第三LSTM隐藏层和第四LSTM隐藏层;所述第三LSTM隐藏层包含多个第三LSTM神经单元,所述第四LSTM隐藏层包含多个第四LSTM神经单元;所述使用解码器对所述关键词的词向量以及所述隐藏层状态向量进行解码处理,以生成所述提问语句对应的回复语句,包括:将排序后的多个所述词向量中的最后一个词向量对应的第一LSTM神经单元的第一隐藏层状态向量、第二LSTM神经单元的第二隐藏层状态向量以及所述关键词的词向量输入所述解码器;通过所述第三LSTM神经单元将其对应的前一第三LSTM神经单元的第三隐藏层状态向量以及所述关键词的词向量代入第三非线性激活函数,以计算所述第三LSTM神经单元对应的第三隐藏层状态向量,其中,多个所述第三LSTM神经单元中的第一个第三LSTM神经单元对应的前一第三LSTM神经单元的第三隐藏层状态向量的取值为所述第一隐藏层状态向量;通过所述第四LSTM神经单元将其对应的第三LSTM神经单元的第三隐藏层状态向量、前一第四LSTM神经单元的第四隐藏层状态向量以及所述前一第四LSTM神经单元对应的待解码词向量代入第四非线性激活函数,以计算所述第四LSTM神经单元对应的第四隐藏层状态向量,其中,多个所述第四LSTM神经单元中的第一个第四LSTM神经单元对应的前一第四LSTM神经单元的第四隐藏层状态向量的取值为所述第二隐藏层状态向量,所述前一第四LSTM神经单元对应的待解码词向量的取值为空向量;根据所述第四LSTM神经单元对应的第四隐藏层状态向量确定所述第四LSTM神经单元对应的待解码词向量,并对所述待解码词向量进行解码处理,以生成所述第四LSTM神经单元对应的解码词;当所述第四LSTM神经单元对应的解码词为句末标识符时,根据所述第四LSTM神经单元的前N个第四LSTM神经单元对应的解码词生成所述提问语句对应的回复语句...

【专利技术属性】
技术研发人员:姚丽丽
申请(专利权)人:出门问问信息科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1