用于执行目标任务的模型的训练方法、装置及设备制造方法及图纸

技术编号:40593014 阅读:20 留言:0更新日期:2024-03-12 21:54
本公开提供了一种用于执行目标任务的模型的训练方法、装置及设备,涉及人工智能技术领域,尤其涉及语音处理、自然语言处理、图像处理领域。实现方案为:获取用于执行目标任务的第一教师模型;基于多个第一量化因子对第一教师模型进行多次离线量化,以相应获得多个第一量化模型;确定每个第一量化模型的第一预设指标,以在多个第一量化模型中确定第一预设指标满足第一预设条件的多个第二量化模型,并相应获取多个第二量化因子;针对每个第二量化因子,执行量化操作,以获得多个第二量化因子对应的多个第三量化模型;以及将多个第三量化模型中的预设指标最优的第三量化模型确定为目标量化模型。

【技术实现步骤摘要】

本公开涉及人工智能,尤其涉及语音处理、自然语言处理、图像处理领域,具体涉及一种用于执行目标任务的模型的训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品。


技术介绍

1、人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。

2、模型压缩是指在保证模型精度和性能的前提下,通过减少模型的大小、降低模型复杂度、优化模型结构等方式,实现模型压缩的方法。模型压缩的主要目的是减小模型的存储空间和计算资源需求,提高模型的推理速度和效率,同时保持模型的准确性和性能。模型压缩在深度学习领域具有广泛的应用价值,例如在嵌入式设备、移动设备、物联网等领域中,由于存储空间和计算资源的限制,模型压缩显得尤为重要。

3、在此部分中描述的方法不一定是之前已经本文档来自技高网...

【技术保护点】

1.一种用于执行目标任务的模型的训练方法,其中,所述目标任务为语音处理、自然语言处理以及图像处理中的一项,所述方法包括:

2.根据权利要求1所述的方法,其中,所述多个第一量化因子分别对应于所述第一教师模型的多个网络层,并且所述多个第一量化因子中的每个第一量化因子基于该第一量化因子对应的网络层的参数分布确定。

3.根据权利要求1所述的方法,还包括:

4.根据权利要求3所述的方法,其中,所述获取用于执行所述目标任务的多个第一教师模型包括:

5.根据权利要求4所述的方法,还包括:

6.根据权利要求3-5中任一项所述的方法,所述基于所述...

【技术特征摘要】

1.一种用于执行目标任务的模型的训练方法,其中,所述目标任务为语音处理、自然语言处理以及图像处理中的一项,所述方法包括:

2.根据权利要求1所述的方法,其中,所述多个第一量化因子分别对应于所述第一教师模型的多个网络层,并且所述多个第一量化因子中的每个第一量化因子基于该第一量化因子对应的网络层的参数分布确定。

3.根据权利要求1所述的方法,还包括:

4.根据权利要求3所述的方法,其中,所述获取用于执行所述目标任务的多个第一教师模型包括:

5.根据权利要求4所述的方法,还包括:

6.根据权利要求3-5中任一项所述的方法,所述基于所述多个第二样本数据,对所述初始量化模型进行训练,以获得该第二量化因子对应的第三量化模型包括:

7.一种用于执行目标任务的模型的训练装置,其中,所述目标任务为语音处理、自然语言处理以及图像处理中的一项,所...

【专利技术属性】
技术研发人员:杨歌
申请(专利权)人:百度时代网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1