【技术实现步骤摘要】
一种动态融合词典信息的中文命名实体识别方法和装置
[0001]本专利技术涉及深度学习自然语言处理
,具体而言涉及一种动态融合词典信息的中文命名实体识别方法和装置。
技术介绍
[0002]命名实体识别是自然语言处理任务的基础性工作,对下游任务的关系抽取,信息检索,知识问答,机器翻译起到了重要作用。实体识别主要包括实体边界的准确识别和实体类别的正确分类。中文命名实体识别比英文命名实体识别更加困难。大的方面来讲,实体识别主要包括基于字粒度,词粒度,字词混合的三种特征方法。前人的研究发现,由于中文分词在词典中经常出现未登录词的情况,以及可能会出现错误的分词边界。命名实体识别中,实体的边界一般都是分词的边界,以上两点情况会对命名实体识别效果产生严重负面影响。所以基于字符粒度的方法要比基于分词的方法效果更佳。由于词的信息也是至关重要的,所以出现了以字符粒度为主,并向其中融合潜在的词信息的字词混合方法。
[0003]对于不同垂直领域的命名实体而言,几乎都不会存在完美的分词算法模型,这就会对之后的命名实体识别产生负面的效果。为 ...
【技术保护点】
【技术特征摘要】
1.一种动态融合词典信息的中文命名实体识别方法,其特征在于,所述识别方法包括以下步骤:S1,接收待识别句子,为句子中的每个字从词典中匹配相关的词汇;S2,利用self
‑
attention作为字词信息融合器来动态的学习字与对应的词之间的相关性权重,以融合字词信息;融合过程包括:对每个单词集合的嵌入表示进行线性变换和tanh激活函数,利用self
‑
attention计算字符嵌入表示与每个单词集中各单词的嵌入表示注意力得分,在四个单词集注意力得分上进行归一化得到四个集合的字词权重;分别在四个集合上,利用权重对每个集合中的词汇嵌入进行加权求和;在字词嵌入表示最后维度进行拼接得到字词融合信息表示;S3,采用改进的Transformer层,在建模上下文的语义信息的同时,通过优化初始位置编码的方式融入位置信息;S4,将步骤S3中学习得到的上下文表示输入到条件随机场进行预测。2.根据权利要求1所述的动态融合词典信息的中文命名实体识别方法,其特征在于,步骤S2中,融合过程包括以下子步骤:S21,针对句子S={x1,x2,x3,...,x
n
}中的每个字x
i
,从词典L中匹配相关的词汇,i=1,2,...,n,n是该句子中的字总数;S22,将匹配到的词汇放到四个不同的集合中,方法如下:其中,当一个词汇集合为空时,向其中添加一个特殊符号“None”;B(x
i
)、M(x
i
)、E(x
i
)、S(x
i
)分别表示句子中第i个字在词典中匹配到的以x
i
开头、x
i
在词中间、以x
i
结尾、x
i
单独构成一个词的词集;W
x,y
表示句子中第x至第y个字组成的词;S23,在嵌入层,采用self
‑
attention学习字和四个集合中每个词的相关性权重以融合字词信息:fusion=[e
c
(x
i
);u(B);u(M);u(E);u(S)]u(α)=weight(α)e
w
(y),y∈αweight(α)=softmax([score(B);score(M);score(E);score(S)])[α]score(β)=e
c
(x
i
)v(β)
T
v(β)=tanh(e
w
(y)X+b),y∈β其中,e
c
、e
w
分别表示字符嵌入和词嵌入查找表,[;]表示在向量最后维度上的拼接操作,[]表示按照B,M,E,S符号在weight中进行对应的取值操作;fusion是字词融合函数;u是用来对各个词集进行加权求和的函数;weight是对四个词集注意力权重进行归一化的函数;score函数用来计算字和对应词集的注意力得分;v函数对各个词集的词向量表示进行一次线性变换和一次激活函数。3.根据权利要求1所述的动态融合词典信息的中文命名实体识别方法,其特征在于,步骤S3中,采用改进的Transformer层建模上下文的语义信息的过程包括以下步骤:
S31,对于位置方向缺失的问题,采用以下相对位置编码的方法,定义如下:S31,对于位置方向缺失的问题,采用以下相对位置编码的方法,定义如下:其中,i,j分别表示当前的token和上...
【专利技术属性】
技术研发人员:王立松,孙明杰,刘绍翰,黄玉划,
申请(专利权)人:南京航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。