一种隐式篇章关系识别模型的构建方法及其应用技术

技术编号:38206871 阅读:22 留言:0更新日期:2023-07-21 16:54
本发明专利技术公开了一种隐式篇章关系识别模型的构建方法及其应用,建立了基于任务增强提示学习的隐式篇章关系识别模型,包括编码模块、门控融合模块和语义标签分类模块。该构建方法首先对论元进行模板化,利用输入的论元、连接词等信息构成合适的提示模板并使用编码模块进行编码,得到[MASK]、[CLS]的隐层向量;通过门控融合模块将[CLS]的隐层向量融入主任务[MASK]的隐层向量中得到新的[MASK]隐层向量;最后通过语义标签分类模块预测两个论元之间的隐式篇章关系识别结果。本发明专利技术采用任务增强提示学习的方式对隐式篇章关系识别任务的论元、连接词等信息进行了更加全面的建模,有效的提高了隐式篇章关系识别的准确度。的提高了隐式篇章关系识别的准确度。的提高了隐式篇章关系识别的准确度。

【技术实现步骤摘要】
一种隐式篇章关系识别模型的构建方法及其应用


[0001]本专利技术属于篇章关系识别领域,更具体地,涉及一种隐式篇章关系识别模型的构建方法及其应用。

技术介绍

[0002]隐式篇章关系识别(Implict Discourse Relation Recognition,IDRR)是检测和分类没有显示连接的一对论元(句子或子句)之间的潜在语义关系。IDRR任务对自然语言处理(NLP)领域的许多下游任务至关重要,例如问答系统,信息摘要等等。针对隐式篇章关系识别,现在已经开发出了多种技术,最新的方法大致上可以分为基于“Pre

trained and fine

tuning”的学习范式和“Pre

trained,prompt and predict”的提示学习范式。
[0003]传统的“Pre

trained and fine

tuning”范式通常是把隐式篇章关系识别任务看做分类问题进行解决,关键在于设计一个复杂的下游神经网络(卷积神经网络、循环神本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于任务增强提示学习的隐式篇章关系识别模型的构建方法,其特征在于,包括:S1,搭建隐式篇章关系识别模型;所述隐式篇章关系识别模型包括编码模块、门控融合模块和语义标签分类模块;所述编码模块用于对T
DRR
(x)、T
ssc
(x)、T
ACP
(x
k
)进行联合编码,得到隐层向量其中,T
DRR
(x)、T
ssc
(x)、T
ACP
(x
k
)分别为用于描述自然语言顺序的主任务提示模板、用于描述论元对之间的抽象语义关系的第一辅助任务提示模板、用于描述论元对之间的真实连接词的第二辅助任务提示模板,均为根据数据集中各条数据的论元对构建得到;所述门控融合模块用于将与进行融合得到所述语义标签分类模块用于根据预测所述论元对之间的关系词在全词表上的概率分布并将其映射至T
DRR
(x)的答案空间,并将其中概率最大的关系词对应的语义标签作为识别结果;S2,以最小化分别根据预测出的所述论元对之间的关系词、语义词、隐式连接词与真实标签的差异为目标,采用训练集训练所述隐式篇章关系识别模型;其中所述训练集中的训练样本包括论元对、论元对之间的真实连接词及其对应的语义标签。2.如权利要求1所述的方法,其特征在于,T
DRR
(x
k
)=[Arg1]+Arg1
i
+[MASK]
DRR
+[Arg2]+Arg2
j
;T
SSC
(x
k
)=the sense between[Arg1]and[Arg2]is[MASK]
SSC
;T
ACP
(x
k
)=the connective word is[MASK]
DRR
;其中,Arg1
i
和Arg2
j
为论元对,[Arg1]和[Arg2]为人工插入的用于概括Arg1
i
和Arg2
j
含义的人工标记,[MASK]
DRR
用于在T
DRR
(x)的答案空间中预测论元对之间的关系词;[MAS...

【专利技术属性】
技术研发人员:张青项威王邦梁超徐明华
申请(专利权)人:华中科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1