【技术实现步骤摘要】
基于GRU单元隐藏状态约束的对话方法、存储介质及系统
[0001]本专利技术属于对话系统
,具体涉及一种基于GRU单元隐藏状态约束的对话方法、存储介质及系统。
技术介绍
[0002]近年来,对话系统由于其巨大的潜力、广泛的商业应用场景而备受关注。一方面,自然语言处理技术的不断发展,如循环神经网络(RNN)及其变种(GRU等)、Seq2seq模型、Attention技术等,为对话系统的建立提供了技术基础;另一方面,互联网的极大繁荣也带来了大量的数据集,使得基于数据驱动的、开放领域的对话系统构建成为可能。然而,构建一个语法正确、内容连贯,并且能人机共情、回复合理的对话系统仍然是一个极具难度性的挑战。
[0003]有研究表明,在对话系统中识别、感知用户情感并生成适当回复可以改善用户体验。在实际应用中,让机器人感知到情感面临的困难主要有:
[0004]一,优质语料库的构建。虽然互联网上有大量的语料,但是这些语料常常含有大量的噪音,语料清洗、标注耗费代价较大。这在一定程度上制约了情感对话系统的发展。
[0 ...
【技术保护点】
【技术特征摘要】
1.基于GRU单元隐藏状态约束的对话方法,其特征在于,包括以下步骤:S1、对带有情感标注的对话数据进行预处理,将对话数据转换为单轮对话形式的数据构建数据集;S2、建立一个基于多层GRU单元的神经网络模型,利用步骤S1构建数据集中的情感信息对神经网络模型的GRU单元隐藏状态进行情感约束,得到情感约束后的隐藏状态;S3、对步骤S2情感约束后多层GRU单元中的隐藏状态使用上下层继承机制,对前一层的情感信息进行继承,得到信息融合的GRU单元隐藏状态;S4、使用步骤S3信息融合的GRU单元隐藏状态生成文字的概率分布,然后使用反向传播算法最小化损失值优化神经网络模型的参数,生成带有对应情感的回复信息,实现基于GRU单元隐藏状态约束的对话。2.根据权利要求1所述的方法,其特征在于,步骤S1中,预处理具体为:通过Emotion Embedding将每一种情感标签都转为向量,并在训练之初对向量进行初始化,得到v
e
∈V,v
e
表示某种情感对应的特征向量,V表示情感特征向量的集合。3.根据权利要求1所述的方法,其特征在于,步骤S1中,数据集包括多个完整的数据元组,数据元组包括一个Post序列和一个Response序列,Post序列X={x1,x2,
…
,x
n
}表示长度为n的输入序列,Response序列Y={y1,y2,
…
,y
m
,e}表示长度为m的回复序列,拥有一个情感标签e∈E,代表当前这一数据元组的情感标签,E为数据集的情感标签集合。4.根据权利要求1所述的方法,其特征在于,步骤S2的情感约束过程中,在编码阶段,基于多层GRU单元的神经网络模型接收输入并不断更新隐藏状态;在解码阶段,使用情感提取器在每次解码时从输入GRU单元的隐藏状态中提取当前的情感特征,依次计算解码阶段一...
【专利技术属性】
技术研发人员:赵国帅,毛艺钧,许文雄,钱学明,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。