【技术实现步骤摘要】
一种命名实体识别模型训练的优化方法、设备及存储介质
[0001]本专利技术涉及人工智能
,特别是涉及一种命名实体识别模型训练的优化方法、设备及存储介质。
技术介绍
[0002]在命名实体识别任务中,命名实体识别模型的训练过程中需要损失函数来判断模型训练是否收敛,损失函数的作用就是描述模型的预测值与真实值之间的差距大小,以损失函数作为一个标准来帮助训练机制提高模型的识别准确率,即指导模型在训练过程中朝着收敛的方向前进,所以损失函数的计算直接影响着模型的识别精度。
[0003]CN110362814A中公开了一种基于改进损失函数的命名实体识别方法及装置,所述方法包括:将训练数据输入到命名实体识别模型中,得到训练数据中的实体的预测值和非实体的预测值;根据训练数据中的实体的真实值和预测值计算改进损失函数,或根据训练数据中的非实体的真实值和预测值计算改进损失函数;其中,改进损失函数用于提高训练数据中的实体样本的权重,并用于提高命名实体识别模型对模棱两可的训练数据的关注度。但是上述现有技术也存在着以下技术问题:不同实体类型的实体数量对模型损失函数的影响不同,出现概率比较低的实体类型,模型较难学会,因此模型训练时对所有实体采用同样的权重计算出的损失函数Loss的精准性较低,会导致模型训练达到收敛的判定不准确,导致模型准确率在提高到一定数值后难以继续提高。
技术实现思路
[0004]针对上述技术问题,本专利技术采用的技术方案为:一种命名实体识别模型训练方法,包括以下步骤:S100,获取u个数据集data ...
【技术保护点】
【技术特征摘要】
1.一种命名实体识别模型训练的优化方法,其特征在于,所述方法包括以下步骤:S100,获取u个数据集data中的m个实体类型的实体数量n={n1,n2,
…
,n
k
,
…
,n
m
},其中,n
k
为第k个实体类型在data中的实体数量,k的取值范围为1到m;S200,根据实体数量n获取实体数量平均值n
'
和m个实体类型的个体差异程度δ(n)={δ(n1),δ(n2),
…
,δ(n
k
),
…
,δ(n
m
)},其中,δ(n
k
)为第k个实体数量n
k
的个体差异程度,k的取值范围为1到m;δ(n
k
)与n
k
和n
'
的差距正相关;S300,获取个体差异程度δ(n)的平均值δ
'
(n),若δ(n
k
)≥δ
'
(n)且n
k
≤n
'
,则将第k个实体类型划分到第一训练集{Fentity1,Fentity2,
…
,Fentity
p
,
…
,Fentity
L
},其中,Fentity
p
为第一训练集中的第p个实体类型集,1≤p≤L,否则,将第k个实体类型划分到第二训练集{Sentity1,Sentity2,
…
,Sentity
q
,
…
,Sentity
T
},其中,Sentity
q
为第二训练集中的第q个实体类型集,1≤q≤T,且L+T=m;S400,根据第一训练集中第p个实体类型Fentity
p
的实体类型权重f(h
p
)和调整因子factor_show_rate
p
获取第一训练集中第p个实体类型Fentity
p
的第一实体权重Fentity_weight
p
;Fentity_weight
p
分别与f(h
p
)和factor_show_rate
p
呈正相关;f(h
p
)与Fentity
p
的实体数量占比呈负相关,Fentity
p
的实体数量占比为实体数量n
p
在data所有实体数量中所占的比例;所述factor_show_rate
p
与Fentity
p
的实体数量h
p
呈正相关且与包含Fentity
p
的data的数量呈负相关;S500,根据第二训练集中的第q个实体类型Sentity
q
的实体数量获取Sentity
q
的第二实体权重Sentity_weight
q
,Sentity_weight
q
与Sentity
q
的实体数量占比呈负相关,Sentity
q
的实体数量占比为实体数量n
p
在data所有实体数量中所占的比例;S600,获取命名实体识别模型的损失函数Loss;所述损失函数Loss满足:Loss=∑
Lp=1
(Floss
p
*Fentity_weight
p
)+∑
Tq=1
(Sloss
q
*Sentity_weight
q
)其中,Floss
p
为Fentity
p
的交叉熵损失函数,Sloss
q
为Sentity
q
的交叉熵损失函数,Fentity_weight
p
...
【专利技术属性】
技术研发人员:王全修,于伟,靳雯,赵洲洋,石江枫,王明超,
申请(专利权)人:日照睿安信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。