模型优化方法、装置、电子设备和计算机可读存储介质制造方法及图纸

技术编号:33927989 阅读:45 留言:0更新日期:2022-06-25 22:01
本申请实施例公开了一种模型优化方法、装置、电子设备和计算机可读存储介质;在本申请实施例中,获取待标注文本,并将所述待标注文本输入至已训练神经网络模型中进行标注,得到所述待标注文本的目标标注结果;确定所述目标标注结果的对错状态;基于所述对错状态更新所述已训练神经网络模型中奖励惩罚参数,得到更新奖励惩罚参数;基于所述更新奖励惩罚参数,对所述已训练神经网络模型进行优化。本申请实施例可以提高标注的准确度。施例可以提高标注的准确度。施例可以提高标注的准确度。

【技术实现步骤摘要】
模型优化方法、装置、电子设备和计算机可读存储介质


[0001]本申请涉及人工智能
,具体涉及一种模型优化方法、装置、电子设备和计算机可读存储介质。

技术介绍

[0002]随着科学技术的发展,神经网络模型的应用越来越广泛。比如,将神经网络模型用于自然语言理解(NLP,Natural Language Processing)中。
[0003]在自然语言理解中,需要对文本进行标注。然而,如果训练样本不均衡,则会导致在使用训练得到的神经网络模型对文本进行标注时,标注的准确率较低。

技术实现思路

[0004]本申请实施例提供一种模型优化方法、装置、电子设备和计算机可读存储介质,可以解决训练样本不均衡,标注的准确率较低的技术问题。
[0005]一种模型优化方法,包括:
[0006]获取待标注文本,并将所述待标注文本输入至已训练神经网络模型中进行标注,得到所述待标注文本的目标标注结果;
[0007]确定所述目标标注结果的对错状态;
[0008]基于所述对错状态更新所述已训练神经网络模型中奖励惩罚参数,得到更新奖励惩罚参数;
[0009]基于所述更新奖励惩罚参数,对所述已训练神经网络模型进行优化。
[0010]可选地,所述基于所述对错状态更新所述已训练神经网络模型中奖励惩罚参数,得到更新奖励惩罚参数,包括:
[0011]若所述对错状态为正确状态,则对所述已训练神经网络模型中奖励惩罚参数增加预设参数,得到更新奖励惩罚参数;
[0012]若所述对错状态为错误状态,则对所述已训练神经网络模型中奖励惩罚参数减去所述预设参数,得到更新奖励惩罚参数。
[0013]可选地,所述奖励惩罚参数包括奖励子参数和惩罚子参数;
[0014]所述基于所述对错状态更新所述已训练神经网络模型中奖励惩罚参数,包括:
[0015]若所述对错状态为正确状态,则对所述已训练神经网络模型中所述奖励子参数增加预设参数,得到更新奖励子参数;
[0016]若所述对错状态为错误状态,则对所述已训练神经网络模型中所述惩罚子参数增加所述预设参数,得到更新惩罚子参数。
[0017]可选地,在所述若所述对错状态为正确状态,则对所述已训练神经网络模型中所述奖励子参数增加预设参数,得到更新奖励子参数之前,还包括:
[0018]获取所述已训练神经网络模型的优化次数、原始参数、初始后的奖励子参数;
[0019]根据所述优化次数、所述原始参数以及所述初始后的奖励子参数确定预设参数。
[0020]可选地,所述确定所述目标标注结果的对错状态,包括:
[0021]将所述目标标注结果输出,以供用户查看;
[0022]接收所述用户输入的所述目标标注结果的对错状态。
[0023]可选地,在所述将所述待标注文本输入至已训练神经网络模型中进行标注,得到所述待标注文本的目标标注结果之前,还包括:
[0024]获取训练标注文本集;
[0025]将所述训练标注文本集中样本输入至待训练神经网络模型中进行标注,得到目标损失值;
[0026]若所述目标损失值满足预设条件,则将所述待训练神经模型作为所述已训练神经网络模型;
[0027]若所述目标损失值不满足预设条件,则基于所述目标损失值更新所述待训练神经网络模型的参数,并返回执行将所述训练标注文本集输入至待训练神经网络模型中进行标注的操作。
[0028]可选地,所述训练标注文本集包括训练集以及测试集;
[0029]将所述训练标注文本集样本输入至待训练神经网络模型中进行标注,得到目标损失值,包括:
[0030]将所述训练集中样本输入至待训练神经网络模型中进行标注,得到目标损失值;
[0031]所述若所述目标损失值满足预设条件,则将所述待训练神经模型作为所述已训练神经网络模型,包括:
[0032]若所述目标损失值满足预设条件,则得到候选神经网络模型;
[0033]将所述测试集中样本输入至所述候选神经网络模型中进行标注,得到验证标注结果;
[0034]基于所述验证标注结果确定初始准确率;
[0035]若所述初始准确率大于预设阈值,则将所述候选神经网络模型作为所述已训练神经网络模型。
[0036]可选地,在所述基于所述验证标注结果确定初始准确率之后,还包括:
[0037]若所述初始准确率小于或等于所述预设阈值,则基于所述验证标注结果更新训练集,将所述候选神经网络模型作为所述待训练神经网络模型,并返回执行将所述训练集中样本输入至待训练神经网络模型中进行标注的操作。
[0038]可选地,所述若所述初始准确率小于或等于所述预设阈值,则基于所述验证标注结果更新训练集,包括:
[0039]若所述初始准确率小于或等于所述预设阈值,则将所述验证标注结果输出;
[0040]接收用户基于所述验证标注结果输入的所述训练集的更新结果,得到更新训练集,并将所述更新训练集作为训练集。
[0041]可选地,所述基于所述对错状态更新所述已训练神经网络模型中奖励惩罚参数,得到更新奖励惩罚参数,包括:
[0042]基于所述对错状态确定所述目标标注结果的目标准确率;
[0043]若所述目标准确率小于第一阈值,则基于所述对错状态更新所述已训练神经网络模型中奖励惩罚参数,得到更新奖励惩罚参数;
[0044]所述基于所述更新奖励惩罚参数,对所述已训练神经网络模型进行优化,包括:
[0045]将所述更新奖励惩罚参数作为所述已训练神经网络模型中当前的奖励惩罚参数,并返回执行将所述待标注文本输入至已训练神经网络模型中进行标注的操作。
[0046]可选地,在所述基于所述对错状态确定所述目标标注结果的目标准确率之后,还包括:
[0047]若所述目标准确率等于或大于第一阈值,则将所述已训练神经网络模型作为优化后的神经网络模型。
[0048]可选地,所述将所述更新奖励惩罚参数作为所述已训练神经网络模型中当前的奖励惩罚参数,并返回执行将所述待标注文本输入至已训练神经网络模型中进行标注的操作,包括:
[0049]将所述更新奖励惩罚参数作为所述已训练神经网络模型中当前的奖励惩罚参数,并确定错误状态的目标标注结果,对应的待标注文本的目标类型;
[0050]若所述目标类型为标记类型,则返回执行将所述待标注文本输入至已训练神经网络模型中进行标注的操作。
[0051]可选地,在所述确定错误状态的目标标注结果,对应的待标注文本的目标类型之后,还包括:
[0052]若所述目标类型为未标记类型,则将所述已训练神经网络模型作为待训练神经网络模型;
[0053]在所述训练标注文本集添加所述未标记类型对应的样本,得到添加标注文本集,并将所述添加标注文本集作为所述训练标注文本集,返回执行将所述训练标注文本集中样本输入至待训练神经网络模型中进行标注,得到目标损失值的操作。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型优化方法,其特征在于,包括:获取待标注文本,并将所述待标注文本输入至已训练神经网络模型中进行标注,得到所述待标注文本的目标标注结果;确定所述目标标注结果的对错状态;基于所述对错状态更新所述已训练神经网络模型中奖励惩罚参数,得到更新奖励惩罚参数;基于所述更新奖励惩罚参数,对所述已训练神经网络模型进行优化。2.根据权利要求1所述的模型优化方法,其特征在于,所述基于所述对错状态更新所述已训练神经网络模型中奖励惩罚参数,得到更新奖励惩罚参数,包括:若所述对错状态为正确状态,则对所述已训练神经网络模型中奖励惩罚参数增加预设参数,得到更新奖励惩罚参数;若所述对错状态为错误状态,则对所述已训练神经网络模型中奖励惩罚参数减去所述预设参数,得到更新奖励惩罚参数。3.根据权利要求1所述的模型优化方法,其特征在于,所述奖励惩罚参数包括奖励子参数和惩罚子参数;所述基于所述对错状态更新所述已训练神经网络模型中奖励惩罚参数,包括:若所述对错状态为正确状态,则对所述已训练神经网络模型中所述奖励子参数增加预设参数,得到更新奖励子参数;若所述对错状态为错误状态,则对所述已训练神经网络模型中所述惩罚子参数增加所述预设参数,得到更新惩罚子参数。4.根据权利要求3所述的模型优化方法,其特征在于,在所述若所述对错状态为正确状态,则对所述已训练神经网络模型中所述奖励子参数增加预设参数,得到更新奖励子参数之前,还包括:获取所述已训练神经网络模型的优化次数、原始参数、初始后的奖励子参数;根据所述优化次数、所述原始参数以及所述初始后的奖励子参数确定预设参数。5.根据权利要求1所述的模型优化方法,其特征在于,所述确定所述目标标注结果的对错状态,包括:将所述目标标注结果输出,以供用户查看;接收所述用户输入的所述目标标注结果的对错状态。6.根据权利要求1所述的模型优化方法,其特征在于,在所述将所述待标注文本输入至已训练神经网络模型中进行标注,得到所述待标注文本的目标标注结果之前,还包括:获取训练标注文本集;将所述训练标注文本集中样本输入至待训练神经网络模型中进行标注,得到目标损失值;若所述目标损失值满足预设条件,则将所述待训练神经模型作为所述已训练神经网络模型;若所述目标损失值不满足预设条件,则基于所述目标损失值更新所述待训练神经网络模型的参数,并返回执行将所述训练标注文本集输入至待训练神经网络模型中进行标注的操作。
7.根据权利要求6所述的模型优化方法,其特征在于,所述训练标注文本集包括训练集以及测试集;将所述训练标注文本集样本输入至待训练神经网络模型中进行标注,得到目标损失值,包括:将所述训练集中样本输入至待训练神经网络模型中进行标注,得到目标损失值;所述若所述目标损失值满足预设条件,则将所述待训练神经模型作为所述已训练神经网络模型,包括:若所述目标损失值满足预设条件,则得到候选神经网络模型;将所述测试集中样本输入至所述候选神经网络模型中进行标注,得到验证标注结果;基于所述验证标注结果确定初始准确率;若所述初始准确率大于预设阈值,则将所述候选神经网络模型作为所述已训练神经网络模型。8.根据权利要求7所述的模型优化方法,其特征在于,在所述基于所述验证标注结果确定初始准确率之后,还包括:若所述初始准确率小于或等于所述预设阈值,则基于所述验证标注结果更...

【专利技术属性】
技术研发人员:任希佳盛佳琦
申请(专利权)人:深圳TCL新技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1