异构计算架构下的模型精度调优方法及电子设备技术

技术编号:43432830 阅读:16 留言:0更新日期:2024-11-27 12:42
本申请提供一种异构计算架构下的模型精度调优方法及电子设备。所述方法应用于具有多核异构特性的片上系统中。所述方法包括:将第一数据验证集中的数据输入原始神经网络模型,获得原始神经网络模型的各个神经网络层输出的数据;对各个神经网络层输出的数据逐层进行分析,以确定存在数据分布缺失的第一神经网络层,对第一神经网络层进行精度补偿;验证第一神经网络模型的精度是否达到目标精度范围;在未达到目标精度范围的情况下,继续对第一神经网络模型进行精度调整,直至达到目标精度范围。本申请实施例可以实现神经网络加速器在保持低比特、高性能运算的同时,进行高精度的模型推理计算,使得神经网络加速器得以充分有效的利用。

【技术实现步骤摘要】

本申请涉及计算机,特别涉及一种异构计算架构下的模型精度调优方法及电子设备


技术介绍

1、随着人工智能的快速发展,车载片上系统(system on chip,soc)一般集成了专用的神经网络处理器(neural processing unit,npu),专用的神经网络处理器(neuralprocessing unit,npu)、中央处理器(central pr ocessing unit,cpu)、图形处理器(graphics processing unit,gpu)以及数字信号处理器(digital signal processor,dsp)一起来承载神经网络模型的计算,这些计算单元(处理器)一同形成了一个异构的计算平台,用于诸如文档管理系统(document management system,dms)、高级驾驶辅助系统(advanced driving assistance system,adas)等各类智能分析应用。

2、为了提高计算效率和效能,专用的神经网络处理器一般采用低比特整型存储算法模型参数和激活,并进行整型数字的计算来替代原始本文档来自技高网...

【技术保护点】

1.一种异构计算架构下的模型精度调优方法,其特征在于,所述方法应用于具有多核异构特性的片上系统中,所述片上系统的硬件部分至少包括中央处理器和图形处理器;所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,对所述各个神经网络层输出的数据逐层进行分析,以确定是否存在数据分布缺失,且所述数据分布缺失超过至少一个数量级的第一神经网络层,包括:

4.根据权利要求3所述的方法,其特征在于,当存在数据分布缺失,且所述数据分布缺失超过至少一个数量级的神经网络层时,对所述第一神经网络层进行精度补偿,包括:...

【技术特征摘要】

1.一种异构计算架构下的模型精度调优方法,其特征在于,所述方法应用于具有多核异构特性的片上系统中,所述片上系统的硬件部分至少包括中央处理器和图形处理器;所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,对所述各个神经网络层输出的数据逐层进行分析,以确定是否存在数据分布缺失,且所述数据分布缺失超过至少一个数量级的第一神经网络层,包括:

4.根据权利要求3所述的方法,其特征在于,当存在数据分布缺失,且所述数据分布缺失超过至少一个数量级的神经网络层时,对所述第一神经网络层进行精度补偿,包括:

5.根据权利要求1所述的方法,其特征在于,验证所述第一神经网络模型的精度是否达...

【专利技术属性】
技术研发人员:汤峰峰
申请(专利权)人:北京芯驰半导体科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1