【技术实现步骤摘要】
一种用于框架语义解析的基于跨度的目标感知方法
[0001]本专利技术属于自然语言处理领域,具体涉及一种用于框架语义解析的基于跨度的目标感知方法
。
技术介绍
[0002]框架语义解析是自然语言处理领域一项具有挑战性的关键任务,识别目标词在文本中激活的语义框架及其语义角色,在
FrameNet
项目中得到了形式化的表述
。
具体来说,框架代表事件的语义情景,并且拥有参与事件的框架元素或语义角色,这是基于框架语义理论的
。
框架语义在事件识别
、
机器阅读理解
、
关系提取和文本生成等任务中具有重要作用
。
框架语义解析任务首次提出
2002
年,自
SemEval 2007
共享任务发布以来,引起了极大的关注
。
与
PropBank
风格的语义角色标注任务
(SRL)
相比,框架语义解析任务需要处理数千个特定于框架的语义角色,而
Pro ...
【技术保护点】
【技术特征摘要】
1.
一种用于框架语义解析的基于跨度的目标感知方法,其特征在于,包括以下步骤:步骤1,上下文编码:对给定的句子,通过深度上下文化的编码器获得每个词元的隐藏表示;步骤2,跨度表示:将目标词视为一个特殊的跨度,并根据目标词在句中的不同用法,采用不同的表示方法进行跨度表示;步骤3,框架识别:以目标词跨度的表示结果为依据,使用双编码器分别表示目标词和框架,并将目标词和框架映射到同一空间,通过计算相似度来预测框架,并获得用于与角色分类模块交互的框架表示;步骤4,论元识别:基于给定句子的所有可能的连续词跨度,通过候选论元生成和论元分类,识别目标词在对应框架下的真实论元;步骤5,角色分类:预测目标词的真实论元在句子中的角色,独立地对句子中的
(
目标词,论元
)
对之间的关系进行建模
。2.
根据权利要求1所述的一种用于框架语义解析的基于跨度的目标感知方法,其特征在于,所述步骤1具体包括:给定一个句子
x:x0,x1,...,x
m
‑1,使用
BiLSTM
或
BERT
编码器模型获得目标词
x
i
的隐藏表示
h
i
,
h
i
(0≤i≤m
‑
1)
的维度为
d
h
,其计算方法如式
(1)
所示,
h0,h1,...,h
m
‑1=
Encoder(x0,x1,...,x
m
‑1)
ꢀꢀꢀꢀꢀꢀꢀ
(1)
其中,
x
i
(0≤i≤m
‑
1)
为句子
x
中的第
i
个
token
,
h
i
(0≤i≤m
‑
1)
为句子
x
中第
i
个
token
的表示
。3.
根据权利要求1所述的一种用于框架语义解析的基于跨度的目标感知方法,其特征在于,所述步骤2具体包括:将目标词
t
作为一个特殊的跨度,当目标词用于框架识别时,其计算方法如式
(2)
所示,
h
t
=
(h
b
+h
e
)/2
ꢀꢀꢀꢀ
(2)
当目标词
t
作为候选论元跨度时,其计算方法如式
(3)
所示,
h
i:j
=
[h
i
;
h
j
;
h
att
;
E(D(t
→
x
i,j
))
;
E(|x
i,j
|)]
ꢀꢀꢀꢀꢀꢀꢀ
(3)
其中,
h
i:j
为候选论元跨度的编码表示,
h
i
为候选论元跨度起始位置
token
的编码表示,
h
j
为候选论元跨度结束位置
token
的编码表示,
h
att
为目标感知的候选论元跨度表示,
E(.)
为将离散值转换为分布式表示的嵌入函数,
x
i:j
(0≤i≤j≤m
‑
1)
表示从索引
i
到索引
j
的连续片段,
[.
;
.]
表示向量连接,
D(t
→
x
i,j
)
表示目标词与其论元跨度之间的相对距离,其计算方法如式
(4)
所示,其中,
t
为句中的目标词,
b
和
e
为该句中的起始和结束索引;对于跨度中的中间词信息,使用目标感知注意力机制在跨度中对单词进行加权,其注意力权重计算方法如式
(5)
所示,
其中,
a
k
为第
i
个
token
的注意力分数,
h
i
为第
i
个
token
的编码表示,为
h
i
的转置
。4.
根据权利要求1所述的一种用于框架语义解析的基于跨度的目标感知方法,其特征在于,所述步骤3具体包括:对于框架编码,给定框架集
F
=
{f1,f2,...,f
|F|
}
,使用框架编码器将离散的框架标签映射为分布表示,映射函数如式
(6)
所示,
M
(F)
=
[E(f1)
;
E(f2)
;
...
;
E(f
|F|
)]
T
W
(F)
ꢀꢀꢀ
(6)
其中,框架集中的框架数量为
|F|
,
f
i
为框架集中的第
i
个框架,
E(.)
为嵌入函数,
W
(F)
为可学习矩阵,
M
(F)
为每一行代表一个框架的框架矩阵,其维度为
|F|
×
d
f
;对于目标词编码,给定目标词
t
,使用目标词编码器将每个词元的隐藏表示
h
t
映射到与框架表示相同的空间中,映射函数式
(7)
所示,
g
f
(t)
=
W
f
h
t
+b
f
ꢀꢀꢀꢀꢀꢀ
(7)
其中,
g
f
(t)
表示将目标词
t
的隐藏表示
h
t
映射到框架表示的向量空间后的...
【专利技术属性】
技术研发人员:李茹,马博翔,苏雪峰,闫智超,柴清华,谭红叶,梁吉业,张虎,
申请(专利权)人:山西大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。