模型训练方法、装置、电子设备和存储介质制造方法及图纸

技术编号:45030327 阅读:24 留言:0更新日期:2025-04-18 17:09
本发明专利技术提供一种模型训练方法、装置、电子设备和存储介质,方法包括:确定待训练的全局模型,以及确定基于标注数据训练得到的参考模型;分别基于全局模型和参考模型对标注数据进行推理,得到标注数据的全局推理结果和参考推理结果,并基于标注数据的全局推理结果和参考推理结果,以及标注数据的标签,确定全局模型的标注偏差量;分别基于全局模型和参考模型对未标注数据进行推理,得到未标注数据的全局推理结果和参考推理结果,并基于未标注数据的全局推理结果和参考推理结果,以及标注偏差量,对全局模型进行参数迭代,以完成模型训练。本发明专利技术提供的模型训练方法、装置、电子设备和存储介质,用参考和全局模型推理未标注数据,提升了其使用效率。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及一种模型训练方法、装置、电子设备和存储介质


技术介绍

1、随着人工智能技术的快速发展,基于大规模数据的机器学习模型在诸多领域得到了广泛应用,例如医疗健康、金融服务和工业互联网等。然而,许多场景中标注数据的获取存在显著挑战:标注过程需要耗费大量的人力和时间,且某些领域(如医疗诊断、法律分析)对标注精度要求极高,进一步增加了数据标注的难度。这使得未标注数据成为了一种潜在的重要资源。

2、在传统机器学习中,未标注数据利用效率低,主要因其缺乏标签无法参与训练,导致数据资源浪费;依赖少量标注数据的模型难以捕捉数据分布的多样性,泛化能力较弱;人工标注成本高,自动化伪标签生成机制不足。此外,未标注数据的分布复杂性和不均衡性进一步增加了利用难度,因此,提高未标注数据的利用效率对模型性能提升至关重要。


技术实现思路

1、本专利技术提供一种模型训练方法、装置、电子设备和存储介质,用以解决相关技术中未标注数据利用效率低的缺陷。

2、本专利技术提供一种模型训练方法,包括如下步本文档来自技高网...

【技术保护点】

1.一种模型训练方法,其特征在于,包括:

2.根据权利要求1所述的模型训练方法,其特征在于,所述基于所述标注数据的全局推理结果和参考推理结果,以及所述标注数据的标签,确定所述全局模型的标注偏差量,包括:

3.根据权利要求1所述的模型训练方法,其特征在于,所述基于所述未标注数据的全局推理结果和参考推理结果,以及所述标注偏差量,对所述全局模型进行参数迭代,包括:

4.根据权利要求1至3中任一项所述的模型训练方法,其特征在于,所述确定基于标注数据训练得到的参考模型,包括:

5.根据权利要求4所述的模型训练方法,其特征在于,在所述联邦学习为纵向联邦...

【技术特征摘要】

1.一种模型训练方法,其特征在于,包括:

2.根据权利要求1所述的模型训练方法,其特征在于,所述基于所述标注数据的全局推理结果和参考推理结果,以及所述标注数据的标签,确定所述全局模型的标注偏差量,包括:

3.根据权利要求1所述的模型训练方法,其特征在于,所述基于所述未标注数据的全局推理结果和参考推理结果,以及所述标注偏差量,对所述全局模型进行参数迭代,包括:

4.根据权利要求1至3中任一项所述的模型训练方法,其特征在于,所述确定基于标注数据训练得到的参考模型,包括:

5.根据权利要求4所述的模型训练方法,其特征在于,在所述联邦学习为纵向联邦学习的情况下,所述对联邦学习中各方的标注数据进行分组,得到多组标注数据,包括:

6.根据权利要求5所述的模型训练方法,其特征在于,在所述联邦学习为横向联邦学习的情况下,所述对联邦学习中各方的标注数据进行分组,得到多组...

【专利技术属性】
技术研发人员:王宇轩储双双高婷陈巍孟祥桐刘磊汪晶石亚飞黄建贵彭泉明贺茂华万城吕鹏闵超庞天阳
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1