【技术实现步骤摘要】
一种融合参数有效化和关系标签层次语义先验的隐式篇章关系识别方法
[0001]本专利技术涉及自然语言处理
,具体为一种融合参数有效化和关系标签层次语义先验的隐式篇章关系识别方法。
技术介绍
[0002]隐式篇章关系识别是文本分析中最重要的子任务之一,其目的是在没有显式连接词的指导下挖掘两个篇章论元之间的篇章关系。由于缺少连接词,模型只能通过论点之间的实体指代、语义线索来识别特定的篇章关系,这使得隐式篇章关系识别成为一项具有挑战性的任务。通过对该任务更深入的研究,有利于提升对于文本摘要,对话摘要和事件关系抽取等一系列的下游任务的性能。同时,篇章关系在大多数标注体系中被标注为多级粒度标签,并普遍认为在标注时为方便分类加入的隐式连接词是隐式篇章关系任务中最细粒度的篇章关系标签。
[0003]隐式篇章关系识别最初的研究大多基于人类制定的相关语言学特征来进行概率统计模型的构建,如词汇的情感极性、动词、词对以及语境信息等。随着深度学习的不断演进,更多的方法通过循环神经网络(Recurrent Neural Network,RNN)、卷积神经网络(Convoluted Neural Network,CNN)以及长短时记忆网络(Long Short Term Memory,LSTM)来着重提取论元对间的语义交互信息;近来,由于基于自注意力机制的预训练语言模型(Pre
‑
trained Language Models,PLMs)的出现,该任务通过论元间注意力的交互挖掘取得了非常显著的提升。
[00 ...
【技术保护点】
【技术特征摘要】
1.一种融合参数有效化和关系标签层次语义先验的隐式篇章关系识别方法,其特征在于,包括以下步骤:(1)利用参数有效化提示微调在论元对周围插入数个软提示词作为全局语境向量,并冻结预训练模型本身的所有参数,从而驱动输入的嵌入表示进行更新,挖掘隐式篇章关系中论元对涵盖的独特模式以及匹配预训练语言模型预训练过程中的语义特征空间,从而在保留预训练知识的情况下获取特定篇章论元的语义向量表示;(2)替换掩码语言模型原本的词表,并将词表映射为对应篇章关系任务标签的标签词映射矩阵,构成新的掩码语言分类器,通过新分类器将(1)中获得的论元对语义向量表示映射为篇章关系类别的概率分布,并通过交叉熵损失函数来计算训练损失,从而更新整个掩码语言模型的可训练参数;(3)提出一种层次标签精炼的方法,在标签层次,仅保存(2)的掩码语言分类器中最底层的标签嵌入的参数,先通过掩码语言模型提取最细粒度的标签语义知识,而后依据已有的标签先验自下而上地将细粒度标签语义泛化为粗粒度的标签语义表示,由此产生标签层次之间的语义关联,并随着模型的不断更新而探索论元对和篇章关系层次标签相互动态感知的有效表示;(4)通过对篇章关系多个层次进行联合学习,并配合(3)中的方法显式的引入层次化指导,从而将层次化的指导信息注入到提示词中,并仅通过更新提示词以及最细粒度的标签嵌入,来实现小规模数据场景下隐式篇章关系标签层次语义和结构信息的相互感知以提升系统性能完善。2.根据权利要求1所述一种融合参数有效化和关系标签层次语义先验的隐式篇章关系识别方法,其特征在于,步骤(1)具体包括:(101)基于掩码语言模型的篇章论元语义表示获取首先采用改进后的预训练语言模型进行深层篇章论元语义编码;具体方式是采用提示微调的方式,在输入中插入N1个软提示词个软提示词其中V表示词表集合,下同;需要注意的是,为了方便描述,后文叙述的提示词均指软提示词,这些软提示词可以在训练过程通过反向传播的方式自行更新,从而帮助预训练模型适应于特定的任务;输入中的提示词一般插入在两个论元的周围,而标记[MASK]一般插入在两个论元x1和x2之间;通过这种方式来激发预训练过程凝练的丰富语义知识,拉近预训练任务和下游任务的形式差距;经过模板构造后的输入如公式(1)所示:其中[p
×
n
i
]表示该位置插入了n
i
个连续的软提示词,n
i
(i∈{1,2,3,4})表示各个位置插入的软提示词的数量,并且满足获得模板构造完成的后,将其送入到掩码语言模型MLM_Encoder中进行进一步编码,并获取掩码语言模型[MASK]标记位置的输出作为论元对表示过程如公式(2)(3)所示:过程如公式(2)(3)所示:其中S为的长度,H∈R
S
×
d
是编码器最终输出,其中d为隐藏层输出维度,下同,h
s
(s∈
{1,2,...,S})表示第s个位置的隐藏层表示,h
[MASK]
为[MASK]位置的隐藏层表示。3.根据权利要求1所述一种融合参数有效化和关系标签层次语义先验的隐式篇章关系识别方法,其特征在于,步骤(2)具体包括:(201)构建基于提示学习的篇章关系多层分类器为了能够让模型挖掘隐式篇章关系的类别特征,这里采用N2个软提示词来作为标签提示来指导类别预测,这里的N2与层次隐式篇章关系所需总分类数一致,M为篇章关系的总层次数,L
(m)
表示第m层次的标签集合,|L
(m)
|则表示该层次的标签数量;对于所有提示词,将其作为特殊标识插入到词表当中,并将其对应的嵌入层向量进行随机初始化;特别地,对于标签提示词,其通过嵌入层∈获取对应的标签嵌入矩阵的过程如公式(4)所示:其中表示第m层次由软提示词映射而成的标签嵌入组成的矩阵,concat表示对多个嵌入矩阵按第一维进行拼接的函数;(202)单层次篇章关系分类损失传播初步,分别对篇章关系的每一层次进行单独分类,获取到对应层次的类别预测概率分布如公式(5)所示:其中T表示矩阵的转置;对应层次的损失函...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。