【技术实现步骤摘要】
一种融合多路注意力机制的智能对话系统
[0001]本专利技术涉及任务型对话系统领域,具体涉及一种融合多路注意力机制的智能对话系统。
技术介绍
[0002]人机交互技术的发展已经到了一定阶段,许多基于人机交互实现的产品和技术都已在许多领域广泛应用。
[0003]目前人机交互在多通道多媒体的自然用户界面方面的研究发展较为迅猛。不同于传统的图形界面,多通道指通过触觉、听觉、视觉等人类五感以及手势、表情、眼神等这些信息最大程度收集用户的反馈,用户不再依靠机械的设备,而是通过肢体语言,面部表情与计算机交流,交互更为直接和自然。由于研究的进展,近年来,语音合成识别,触摸识别等通过听觉,触觉交互的方式也趋向成熟并得到广泛应用。也有将多通道技术应用于教育领域,通过自然用户界面提高学生沉浸感,并解决部分残疾学生的学习困难问题。但还面临着技术成本高,实现困难等问题。
[0004]虚拟现实和增强现实上的应用也是人机交互研究的热门。利用计算机分析改变人类的五感尤其是视觉和听觉,其在许多领域都有广泛应用。比如在工业领域将增强现实技术引 ...
【技术保护点】
【技术特征摘要】
1.一种融合多路注意力机制的智能对话系统,其特征在于,包括依次连接的编码器模块、多路注意力模块、动态融合模块、外部知识模块和解码器模块;所述编码器模块,用于针对历史上下文进行多领域的编码;所述多路注意力模块,用于提取上下文单词之间的注意力关系;所述动态融合模块,用于融合编码器和注意力的编码结果;所述外部知识模块,用于辅助生成特定领域知识的句子内容;所述解码器模块,用于生成具体的句子内容。2.根据权利要求1所述的一种融合多路注意力机制的智能对话系统,其特征在于,所述编码器模块包括私有编码器和共享编码器。3.根据权利要求2所述的一种融合多路注意力机制的智能对话系统,其特征在于,所述编码器模块从历史上下文中提取通用领域的编码信息,特定领域的编码信息以及领域与领域之间的编码信息,具体如下:利用双向GRU对历史上下文进行编码,每个领域都有自己特有的专属的私有编码器,以及一个共享编码器,故在编码器模块的编码器总数为领域总数+1;所述专属的私有编码器用于提取领域的特定知识,共享编码器用于提取领域之间的公有特征;编码器公式如下:h
i
=BiGRU(e(x),h
i
‑1)其中h
i
是i时刻的隐含层向量,e(x)代表历史上下文单词x的词嵌入表示。最终生成全局上下文隐含层向量定义共享编码器生成的全局上下文隐含层表示为特定域的全局上下文隐含层向量为这里上标d
i
代表领域i的编码。4.根据权利要求3所述的一种融合多路注意力机制的智能对话系统,其特征在于,所述编码器在训练过程中引入一个对抗训练的方式,具体是:构建一个CNN的域分类器来识别对话历史和回复表示的共享表示域,通过引入梯度反转层,使得模型一方面最小化领域分类的误差,另一方面更新分类器底层网络最大化域分类损失。5.根据权利要求1所述的一种融合多路注意力机制的智能对话系统,其特征在于,所述多路注意力模块融合多头注意力,双线性注意力以及拼接注意力注意力机制,并在融合机制后追加一个注意力模块。6.根据权利要求5所述的一种融合多路注意力机制的智能对话系统,其特征在于,所述多头自注意力公式如下:对于多头自注意力而言,Q=K=V=H,为当前编码的单词矩阵;d
k
代表Q和K的维度;拼接自注意力公式如下:拼接自注意力公式如下:
其中代表t时刻第j个单词的自注意力,代表t时刻单词i的权重,代表t时刻的拼接自注意力,和代表拼接注意力的权重矩阵,是权重向量,N是单词的总数;最终生成一个拼接自注意力表示H
concat
;双线性自注意力公式如下:双线性自注意力公式如下:双线性自注意力公式如下:其中代表t时刻第j个单词的自注意力,代表t时刻单词i的权重,代表t时刻的双线性自注意力,W
bi
双线性注意力的权重矩阵,N是单词的总数;最终生成一个双线性自注意力表示H
bi
。7.根据权利要求5所述的一种融合多路注意力机制的智能对话系统,其特征在于,所述在融合...
【专利技术属性】
技术研发人员:廖祥文,陈甘霖,蔡鸿杰,林建洲,杨思源,
申请(专利权)人:福州大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。