【技术实现步骤摘要】
本申请实施例涉及人工智能,尤其涉及一种模型蒸馏方法、装置、设备和介质。
技术介绍
1、随着深度学习技术的发展,小模型(又称为学生模型)得到越来越多研究者的重视。相较于大模型(又称为教师模型),学生模型由于参数量小,推理速度快的特点,在终端设备上具有广泛应用。但学生模型也存在着不能从数据中学习到足够多的特征,导致预测精度往往比教师模型精度低,泛化能力差的缺点。因此,如何将复杂、学习能量强的教师模型学习到的特征(又称为知识)迁移到学生模型上,使得学生模型得到不输于教师模型的性能成为目前的一个难题。
2、相关技术中,可采用模型蒸馏(又称为知识蒸馏)的方式,通过利用教师模型学习到的知识作为标签来监督学生模型的训练过程,从而将教师模型学习到的知识转移到学生模型中,在确保学生模型具备参数量小,推理速度快的特点基础上,使得学生模型的能够获得接近于教师模型性能。
3、然而,模型蒸馏如同普通模型训练一样,也需要使用足够多的训练数据(蒸馏数据)来帮助学生模型学习教师模型。但在模型开发过程中,开发人员往往无法直接获取到足够多的蒸馏数据
...【技术保护点】
1.一种模型蒸馏方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一输出结果置信度和所述第二输出结果置信度,确定所述第一输出结果是否为蒸馏数据,包括:
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
4.根据权利要求3所述的方法,其特征在于,所述根据获取到的反馈信息,确定所述第一输出结果准确,包括:
5.根据权利要求4所述的方法,其特征在于,所述根据所述数据标签,确定所述第一输出结果准确,包括:
6.根据权利要求3所述的方法,其特征在于,所述根据所述第一输出结果和所
...【技术特征摘要】
1.一种模型蒸馏方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一输出结果置信度和所述第二输出结果置信度,确定所述第一输出结果是否为蒸馏数据,包括:
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
4.根据权利要求3所述的方法,其特征在于,所述根据获取到的反馈信息,确定所述第一输出结果准确,包括:
5.根据权利要求4所述的方法,其特征在于,所述根据所述数据标签,确定所述第一输出结果准确,包括:
6.根据权利...
【专利技术属性】
技术研发人员:林泽一,范振,张阳,
申请(专利权)人:北京字跳网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。