一种基于多层级图注意力的对话行为识别方法技术

技术编号:38545025 阅读:23 留言:0更新日期:2023-08-22 20:55
本发明专利技术提供一种基于多层级图注意力的对话行为识别方法,涉及自然语言处理技术领域。该方法首先构建语料库数据集,并对语料库数据集中语句进行句子级别的语意编码;再对对话中语句执行上下文感知语意编码;然后构建窗口内连续对话的局部上下文图;对窗口内局部上下文图进行多层级的基于注意力机制进行语意特征编码,并融合各层级输出的最终用于分类的隐层语意特征;并基于隐层语意特征,使用分类器对对话进行分类;最后使用损失函数计算预测的行为标签和真实行为标签的损失,更新各权重。该方法考虑了说话者之间的相互联系,分析说话人话语之间的联系;构建了基于门图卷积网络的上下文级特征选择,用于选择突出的上下文信息进行DAs预测。行DAs预测。行DAs预测。

【技术实现步骤摘要】
一种基于多层级图注意力的对话行为识别方法


[0001]本专利技术涉及自然语言处理
,尤其涉及一种基于多层级图注意力的对话行为识别方法。

技术介绍

[0002]对话行为(Dialogue Acts,DA)是话语的语义标记,对理解交际至关重要。对话行为分类是为每句对话赋予一个或多个对话行为,从而表示说话人的意图,与人们的生活息息相关,因此,越来越多的学者展开了对话行为分类任务的研究。上下文信息为更好的解释对话提供了关键信息,因此对DAs进行预测需要对上下文很敏感。深度学习方法因其通常模拟相邻话语之间的依赖关系,引起了研究人员广泛的关注,并取得了很好的效果。在预测方面,现有技术将RNN和注意力机制结合起来进一步改进了对DAs的预测。在分类方面,现有技术将DAs分类视为序列到序列的翻译任务,采用条件随机场(Conditional Random Field,CRF)对DAs的顺序依赖关系进行建模。在说话人建模方面,现有技术采用图神经网络对说话人特定的话语进行单独建模。此外,还使用图神经网络来捕捉对话中的上下文信息。
[0003]然而,这些研本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于多层级图注意力的对话行为识别方法,其特征在于:包括以下步骤:步骤1:构建语料库数据集;步骤2:对语料库数据集中语句进行句子级别的语意编码;步骤3:对对话中语句执行上下文感知语意编码;步骤4:构建窗口内连续对话的局部上下文图;步骤5:对窗口内局部上下文图进行多层级的基于注意力机制进行语意特征编码,并融合各层级输出的最终用于分类的隐层语意特征;步骤6:基于步骤5的隐层语意特征,使用分类器对对话进行分类;步骤7:迭代执行步骤1

6,并使用损失函数计算预测的行为标签和真实行为标签的损失,更新步骤1

6中的权重,直至达到设定的终止条件。2.根据权利要求1所述一种基于多层级图注意力的对话行为识别方法,其特征在于:所述步骤1构建语料库数据集其中,Nc是数据集中对话的数量,其中,Nc是数据集中对话的数量,是由一系列语句组成的对话数据,u表示每一句具体的发言,C
m
的标签集y代表每一句话背后的对话行为,n
cm
是对话C
m
中语句的数量,u
i
表示组成对话C
m
的第i个语句,i=1,...,n
cm
。3.根据权利要求2所述一种基于多层级图注意力的对话行为识别方法,其特征在于:所述步骤2使用预训练的语言模型将语料库数据集中每个语句中的单词编码为向量,其中表示第i个语句u
i
中各单词的语意向量,表示单词w
k
在第i个语句u
i
中的语意向量维度,为第i个语句u
i
中的单词数;再对语句中所有单词的语意向量进行均值池化,得到语句的句子级别的语意编码。4.根据权利要求3所述一种基于多层级图注意力的对话行为识别方法,其特征在于:所述步骤3的具体方法为:获得各语句句子级别的语意编码后,使用一个固定的窗口,选择一段连续对话进行上下文感知编码,窗口的长度为n
win
;其次,采用双向长短期记忆网络捕获窗口内的上下文信息,得到窗口所选连续对话的上下文感知语意编码特征。5.根据权利要求4所述一种基于多层级图注意力的对话行为识别方法,其特征在于:所述步骤4的具体方法为:获得上下文感知语意编码特征后,考虑当前需要预测对话行为的句子周围的N
node
个节点,在窗口内有p个过去话语和f个将来话语,构造有向图N
node
=p+f;其中每一个语句被视为有向图的一个节点,节点边表示节点v
i
与v
j
之间的联系,j=[i

p,...,i+f],表示节点间的关系类型,t∈[0,7]为关系索引,表示边的权值,取值为0≤α
ij
≤1。6.根据权利要求5所述一种基于多层级图注意力的对话行为识别方法,其特征在于:所述连接权值α
ij
使用softmax函数设计一个可学习的邻接矩阵来获得;首先,定义8种上下文之间的连接方式即节点间的关系类型来初始化邻接矩阵,即,说话人自身的前向和后向的有向连接,对话人自身的前向和后向的有向连接,说话人到对话人之间的前向和后向的有向连接,对话人到说话人之间的前向和后向的有向连接;初始化的邻接矩阵中,每两个节点

【专利技术属性】
技术研发人员:傅昌锃傅琰邓琪王舒禹刘志刚
申请(专利权)人:东北大学秦皇岛分校
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1