一种神经网络模型的训练方法及装置制造方法及图纸

技术编号:36734117 阅读:27 留言:0更新日期:2023-03-04 10:03
本发明专利技术提供了一种神经网络模型的训练方法、装置、计算机可读存储介质及电子设备,该方法包括:基于标注数据集,训练出生产器模型和监督器模型,其中所述监督器模型以对所述生产器模型的预测结果的评估数据为输出项;基于未标注数据集和所述生产器模型,获取第一预测数据;基于所述未标注数据集、所述第一预测数据和所述监督器模型,获取第一评估数据;基于所述第一评估数据,训练所述生产器模型。在本发明专利技术提供的技术方案中,神经网络模型包括生产器模型和监督器模型,先利用少量的标注数据集训练出生产器模型和监督器模型,用监督器模型对生产器模型的预测结果进行质量评估,进而可以利用未标注数据集有效提升生产器模型的模型性能。性能。性能。

【技术实现步骤摘要】
一种神经网络模型的训练方法及装置


[0001]本专利技术涉及人工智能领域,且更具体地,涉及一种神经网络模型的训练方法及装置。

技术介绍

[0002]随着人工智能技术的发展,神经网络模型已经被广泛的应用在各种领域中,用于完成各种各样的任务,如图像分割、目标检测、自然语言翻译等。在应用神经网络模型时需要先对神经网络模型进行训练,目前训练神经网络模型时需要大量的标注数据,以便在训练过程中不断的对神经网络模型的参数进行调整,当标注数据的数量较少时,难以获取到模型性能较高的神经网络模型。

技术实现思路

[0003]本专利技术提供了一种神经网络模型的训练方法、装置、计算机可读存储介质及电子设备,以解决现有的神经网络模型的训练方法在标注数据较少时,难以获取到模型性能较高的神经网络模型的技术问题。
[0004]根据本专利技术的第一方面,提供了一种神经网络模型的训练方法,包括:
[0005]基于标注数据集,训练出生产器模型和监督器模型,其中所述监督器模型以对所述生产器模型的预测结果的评估数据为输出项;
[0006]基于未标本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种神经网络模型的训练方法,其特征在于,包括:基于标注数据集,训练出生产器模型和监督器模型,其中所述监督器模型以对所述生产器模型的预测结果的评估数据为输出项;基于未标注数据集和所述生产器模型,获取第一预测数据;基于所述未标注数据集、所述第一预测数据和所述监督器模型,获取第一评估数据;基于所述第一评估数据,训练所述生产器模型。2.根据权利要求1所述的方法,其特征在于,所述标注数据集包括第一输入数据和标注数据,则所述基于标注数据集,训练出生产器模型和监督器模型,包括:基于所述第一输入数据、所述标注数据对预设生产器模型进行训练,获取生产器模型和第二预测数据;基于所述第一输入数据、所述第二预测数据、所述标注数据对预设监督器模型进行训练,获取监督器模型。3.根据权利要求2所述的方法,其特征在于,所述基于所述第一输入数据、所述第二预测数据、所述标注数据对预设监督器模型进行训练,获取监督器模型,包括:基于所述第一输入数据和所述第二预测数据构建第二输入数据;基于第二预测数据和所述标注数据,获取标注评估数据;基于所述第二输入数据和所述标注评估数据对预设监督器模型进行训练,获取监督器模型。4.根据权利要求3所述的方法,其特征在于,所述基于所述第一输入数据和所述第二预测数据构建第二输入数据,包括:获取第一输入数据的通道张量;将所述第一预测数据作为附加通道添加至所述第一输入数据的通道张量中,构建第二输入数据。5.根据权利要求3所述的方法,其特征在于,所述方法还包括:基于所述标注数据,确定所述标注数据的补集;则所述基于所述第二预测数据和所述标注数据,获取标注评估数据,包括:基于所述第二预测数据、所述标注数据和所述标注数据的补集...

【专利技术属性】
技术研发人员:请求不公布姓名
申请(专利权)人:上海联麓半导体技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1