【技术实现步骤摘要】
本专利技术涉及人工智能,尤其涉及一种模型训练方法、装置、电子设备和存储介质。
技术介绍
1、随着人工智能技术的快速发展,基于大规模数据的机器学习模型在诸多领域得到了广泛应用,例如医疗健康、金融服务和工业互联网等。然而,许多场景中标注数据的获取存在显著挑战:标注过程需要耗费大量的人力和时间,且某些领域(如医疗诊断、法律分析)对标注精度要求极高,进一步增加了数据标注的难度。这使得未标注数据成为了一种潜在的重要资源。
2、在传统机器学习中,未标注数据利用效率低,主要因其缺乏标签无法参与训练,导致数据资源浪费;依赖少量标注数据的模型难以捕捉数据分布的多样性,泛化能力较弱;人工标注成本高,自动化伪标签生成机制不足。此外,未标注数据的分布复杂性和不均衡性进一步增加了利用难度,因此,提高未标注数据的利用效率对模型性能提升至关重要。
技术实现思路
1、本专利技术提供一种模型训练方法、装置、电子设备和存储介质,用以解决相关技术中未标注数据利用效率低的缺陷。
2、本专利技术提供一种模型
...【技术保护点】
1.一种模型训练方法,其特征在于,包括:
2.根据权利要求1所述的模型训练方法,其特征在于,所述基于所述标注数据的全局推理结果和参考推理结果,以及所述标注数据的标签,确定所述全局模型的标注偏差量,包括:
3.根据权利要求1所述的模型训练方法,其特征在于,所述基于所述未标注数据的全局推理结果和参考推理结果,以及所述标注偏差量,对所述全局模型进行参数迭代,包括:
4.根据权利要求1至3中任一项所述的模型训练方法,其特征在于,所述确定基于标注数据训练得到的参考模型,包括:
5.根据权利要求4所述的模型训练方法,其特征在于,在所
...【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:
2.根据权利要求1所述的模型训练方法,其特征在于,所述基于所述标注数据的全局推理结果和参考推理结果,以及所述标注数据的标签,确定所述全局模型的标注偏差量,包括:
3.根据权利要求1所述的模型训练方法,其特征在于,所述基于所述未标注数据的全局推理结果和参考推理结果,以及所述标注偏差量,对所述全局模型进行参数迭代,包括:
4.根据权利要求1至3中任一项所述的模型训练方法,其特征在于,所述确定基于标注数据训练得到的参考模型,包括:
5.根据权利要求4所述的模型训练方法,其特征在于,在所述联邦学习为纵向联邦学习的情况下,所述对联邦学习中各方的标注数据进行分组,得到多组标注数据,包括:
6.根据权利要求5所述的模型训练方法,其特征在于,在所述联邦学习为横向联邦学习的情况下,所述对联邦学习中各方的标注数据进行分组,得到多组...
【专利技术属性】
技术研发人员:王宇轩,储双双,高婷,陈巍,孟祥桐,刘磊,汪晶,石亚飞,黄建贵,彭泉明,贺茂华,万城,吕鹏,闵超,庞天阳,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。