深度学习模型的训练方法、装置、可读介质和电子设备制造方法及图纸

技术编号:38491146 阅读:31 留言:0更新日期:2023-08-15 17:04
本申请涉及人工智能领域,公开了一种深度学习模型的训练方法、装置、可读介质和电子设备。该方法通过具有标签的第一数据集和不具有标签的第二数据集,对第一模型进行训练,训练过程中,通过调整第一模型参数,得到损失函数满足预设条件的第二模型;该损失函数包括用于指示利用第一模型确定第一数据集中的样本数据的标签的不确定度的第一子损失函数、用于指示利用第一模型确定各样本数据的标签的不确定度的修正参数的第二子损失函数、用于指示属于同一标签的样本数据的数据特征的离散程度之和的第三子损失函数。如此,可以提高第二模型确定输入数据的推理结果的精度。型确定输入数据的推理结果的精度。型确定输入数据的推理结果的精度。

【技术实现步骤摘要】
深度学习模型的训练方法、装置、可读介质和电子设备


[0001]本申请涉及人工智能领域,特别涉及一种深度学习模型的训练方法、装置、可读介质和电子设备。

技术介绍

[0002]随着人工智能技术的发展,深度学习模型的应用越来越广泛,例如可以应用到图像、视频、音频、文字等的识别和分类等场景中。深度学习模型通常基于有标签的样本数据,例如有标签的图像,训练得到。在完成模型训练后,当将待处理的输入数据输入到该模型时,该模型可以输出该输入数据对应的推理结果(例如输入数据的标签)。但是,在将无标签数据输入到上述深度学习模型中时,若深度学习模型中并没有和输入的无标签数据相对应的标签,深度学习模型仍然会为该无标签的数据中确定一个标签,造成误判,影响深度学习模型确定输入数据的推理结果的精度。例如图1A中的有标签的样本图像包括:苹果的图像(标签为“苹果”)、梨的图像(标签为梨),而图1C中的无标签图像包括西瓜的图像,在将西瓜的图像输入到由图1A中的有标签的样本图像训练得到的深度学习模型时,该深度学习模型对西瓜的图像的推理结果会是“苹果”或“梨”,造成误判。此外,由于无标本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种深度学习模型的训练方法,应用于电子设备,其特征在于,包括:获取第一数据集和第二数据集,其中,所述第一数据集中的样本数据的标签构成第一标签集,所述第二数据集的样本数据不具有标签;利用第一模型确定所述第一数据集和所述第二数据集中的各样本数据的数据特征和第一参数,其中,第一样本数据的第一参数用于指示所述第一样本数据被确定为所述第一标签集中的第一标签的概率,所述第一样本数据为所述第一数据集或第二数据集中的任意一个样本数据;基于所述第一数据集和所述第二数据集中的各样本数据的第一参数以及所述第一数据集和所述第二数据集中的各样本数据的数据特征确定所述第一模型的损失函数,所述第一模型的损失函数由第一子损失函数、第二子损失函数和第三子损失函数确定,其中,所述第一子损失函数用于指示利用所述第一模型确定所述第一数据集中的样本数据的标签的不确定度,所述第二子损失函数用于指示利用所述第一模型确定各样本数据的标签的不确定度的修正参数,所述第三子损失函数用于指示属于同一标签的样本数据的数据特征的离散程度之和;在所述第一模型的损失函数不满足预设条件的情况下,调整所述第一模型的参数,得到第二模型,其中,所述第二模型的损失函数满足所述预设条件。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:基于利用所述第二模型得到的所述第一数据集中的各样本数据的第二参数,确定所述第一标签集中的各标签的置信度阈值;所述置信度阈值被所述第二模型用于确定输入到所述第二模型中的输入数据的推理结果。3.根据权利要求1所述的方法,其特征在于,所述第一子损失函数基于所述第一数据集中的各样本数据的第一参数确定。4.根据权利要求1所述的方法,其特征在于,所述第二子损失函数用于降低采用所述第一模型确定所述第一数据集中的各样本数据的标签的不确定度。5.根据权利要求1所述的方法,基特征在于,所述预设条件,包括以下条件中的至少一个:所述损失函数收敛、所述损失函数的值小于预设值、达到预设的迭代次数。6.根据权利要求1所述的方法,其特征在于,所述第一模型包括ResNet网络。7.根据权利要求1所述的方法,其特征在于,所述第一模型的损失函数由第一子损失函数、第二子损失函数和第三子损失函数确定,包括:所述第一模型的损失函数基于以下公式确定:其中,λ为常数;为第一子损失函数;为第二子损失函数;为第三子损失函数。8.一种深度学习模型的训练装置,其特征在于,包括:获取模块,用于获取第一数据集和第二数据集,其中,所述第一数据集中的样本数据的标签构成第一标签集,所述第二数据集的样本数据不具有标签;训练模块,用于利用第一模型确定所述第一数据集和所述第二数据集中的各样...

【专利技术属性】
技术研发人员:楼燚航白涛许俊峰方光祥
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1