基于HRED和内外记忆网络单元的情感对话生成方法技术

技术编号：19009116 阅读：56 留言：0更新日期：2018-09-22 08:59

本发明专利技术提供一种基于HRED和内外记忆网络单元的情感对话生成方法，该方法通过构建特殊的情感聊天对话语料和提出一种基于层次循环神经网络和内外记忆单元的情感对话生成模型来解决情感因素在大规模多轮对话中的嵌入和应用。内部记忆网络的提出提高了情感表达和语法表达之间的自动均衡，外部记忆网络的提出增加了情感的显式表达，使得模型生成的回答更具情感信息。

Emotional dialogue generation method based on HRED and internal and external memory network unit

The invention provides an emotional dialogue generation method based on HRED and internal and external memory network units, which solves the embedding and response of emotional factors in large-scale multi-round conversations by constructing special emotional chat conversation corpus and proposing an emotional dialogue generation model based on hierarchical cyclic neural network and internal and external memory units. Use. The proposed internal memory network improves the automatic balance between emotional expression and grammatical expression. The proposed external memory network increases the explicit expression of emotion, making the response generated by the model more emotional information.

全部详细技术资料下载

【技术实现步骤摘要】
基于HRED和内外记忆网络单元的情感对话生成方法
本专利技术涉及自动对话生成领域，更具体地，涉及一种基于HRED和内外记忆网络单元的情感对话生成方法。
技术介绍
encoder-decoder模型：又叫做编码-解码模型，这是一种应用于seq2seq问题的模型。而seq2seq简单的说，就是根据一个输入序列x，来生成另一个输出序列y。seq2seq有很多的应用，例如翻译，文档摘取，问答系统等等。在翻译中，输入序列是待翻译的文本，输出序列是翻译后的文本；在问答系统中，输入序列是提出的问题，而输出序列是答案。为了解决seq2seq问题，有人提出了encoder-decoder模型，也就是编码-解码模型。所谓编码，就是将输入序列转化成一个固定长度的向量；解码，就是将之前生成的固定向量再转化成输出序列。层次循环编码解码模型（HRED）：HierarchicalRecurrentEncoder-DecoderModel，这是一个两层的Seq2Seq模型。在HRED当中，包含了三个RNN，即一个EncoderRNN，一个ContextRNN和一个DecoderRNN。对于一个输入，首先通过EncoderRNN计算得到一个real-valuedVector，然后将这个Vector作为ContextRNN的输入，做一些归纳的工作得到summary，最后再把这个summary作为DecoderRNN的输入，最终生成回答。而传统的Seq2Seq（EncoderDecoder）则只包含一个EncoderRNN和一个DecoderRNN，这里的ContextRNN每一个Dialog...
基于HRED和内外记忆网络单元的情感对话生成方法

【技术保护点】
1.一种基于HRED和内外记忆网络单元的情感对话生成方法，其特征在于，包括以下步骤：S1：准备情感对话系统数据；S2：对于S1得到的数据集若是单轮对话，利用该单轮对话数据集对编码‑解码模型进行训练，其中在解码模块中添加预先训练的情感类别的词向量以及内外记忆单元，模型训练完毕后进行测试；S3：对于S1中得到的数据集若是多轮对话，利用该多轮对话数据集采用层次循环神经网络模型进行训练，将每轮对话的中间上下文向量与该轮对话的情感向量拼接作为输入另构建一层循环神经网络，模型训练完毕后进行测试，给定一句话和接下来两句话的情感标签，可以生成接下来两轮对话的语句。

【技术特征摘要】
1.一种基于HRED和内外记忆网络单元的情感对话生成方法，其特征在于，包括以下步骤：S1：准备情感对话系统数据；S2：对于S1得到的数据集若是单轮对话，利用该单轮对话数据集对编码-解码模型进行训练，其中在解码模块中添加预先训练的情感类别的词向量以及内外记忆单元，模型训练完毕后进行测试；S3：对于S1中得到的数据集若是多轮对话，利用该多轮对话数据集采用层次循环神经网络模型进行训练，将每轮对话的中间上下文向量与该轮对话的情感向量拼接作为输入另构建一层循环神经网络，模型训练完毕后进行测试，给定一句话和接下来两句话的情感标签，可以生成接下来两轮对话的语句。2.根据权利要求1所述的基于HRED和内外记忆网络单元的情感对话生成方法，其特征在于，所述步骤S1中训练文本情感分类器的模型对比基于词汇的情感分析，选择Bi-LSTM模型，该模型在测试集上的准确率为0.623。3.根据权利要求2所述的基于HRED和内外记忆网络单元的情感对话生成方法，其特征在于，所述步骤S2中情感类别的词向量是经过单独训练的，解码阶段是原始输入与情感向量和上下文向量进行拼接作为新的输入，如果情感向量是静态不变的那么在语...

【专利技术属性】
技术研发人员：卓汉逵，纪登林，
申请(专利权)人：中山大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人