【技术实现步骤摘要】
神经网络模型的量化方法、装置、电子设备和存储介质
[0001]本公开涉及计算机
,尤其涉及人工智能
,具体涉及一种神经网络模型的量化方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
技术介绍
[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]现今深度学习相关的解决方案应用已经越来越多,而其中的神经网络模型在部署阶段又是整个环节重中之重,该环节涉及到两个重要指标,模型运行速度和模型传输带宽,运行速度越快,模型所需传输的带宽越小越能给客户有效提升效率和节约算力,而神经网络的量化是解决此问题的有效方式之一,量化能有效缩小模型的大小以及提升运行速度。
[0004]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。
技术实现思路
[0005]本公开提供了一种神经网络模型的量化方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0006]根据本公开的一方面,提供了一 ...
【技术保护点】
【技术特征摘要】
1.一种神经网络模型的量化方法,包括:获得所述神经网络模型中的待量化层,所述待量化层包括多个通道,所述多个通道中的每一个通道具有相应权值;针对所述多个通道中的每一个通道,基于该通道的相应权值,获得该相应权值对应的频域信息中的高频信息;基于所述多个通道中的每一个通道的相应权值对应的频域信息中的高频信息,获得该通道的更新权值;以及基于所述多个通道中的每一通道的更新权值,对所述待量化层进行量化操作。2.根据权利要求1所述的方法,其中,所述基于该通道的相应权值,获得该相应权值对应的频域信息中的高频信息包括:对所述相应权值进行时频变换,以获得所述相应权值对应的频域信息;以及对所述相应权值对应的频域信息进行滤波操作,以获得所述该相应权值对应的频域信息中的高频信息。3.根据权利要求2所述的方法,其中,所述频域信息包括频谱图,所述频谱图的边缘到中心的谱图对应频域信息中的频率从最低到最高处的信息,所述对所述相应权值对应的频域信息进行滤波操作包括:对所述相应权值对应的频谱图进行移位操作,以获得所述相应权值对应的更新频谱图,其中,在所述权重参数对应的频域信息中频率最低处的信息对应所述更新频谱图的中心;以及去除所述相应权值对应的更新频谱图中的包围所述中心的预设区域,以获得所述相应权值对应的剩余谱图,所述剩余谱图中的谱图对应所述相应权值的频域信息中的高频信息。4.根据权利要求3所述的方法,其中,所述预设区域占据所述更新频谱图的全部区域的1/3到1/2。5.根据权利要求2所述的方法,其中,所述基于所述多个通道中的每一个通道的相应权值对应的频域信息中的高频信息,获得该通道的更新权值包括:基于所述多个通道中的每一个通道的相应权值对应的高频信息,进行反时频变换,以获得该通道的更新权值。6.根据权利要求1所述的方法,其中,所述基于所述多个通道中的每一通道的更新权值,对所述待量化层进行量化操作包括:基于所述多个通道中的每一个通道的更新权值,获得所述待量化层在对应的敏感度;以及将混合精度量化空间的多个量化位宽中获取与所述敏感度相应的量化位宽,确定为所述待量化层的量化位宽。7.根据权利要求6所述的方法,其中,所述基于所述多个通道中的每一个通道的更新权值,获得所述待量化层在对应的敏感度包括:获得所述多个通道中的每一个通道的更新权值的绝对值之和;以及基于所述多个通道对应的多个绝对值之和,获得所述待量化层在对应的敏感度。8.根据权利要求7所述的方法,其中,所述敏感度包括下列各项中的至少一项:
所述多个绝对值之和的平均值;和所述多个绝对值之和中的最大值与最小值之差与所述多个通道的数量之间的比值。9.一种神经网络模型的量化装置,包括:第一获取单元,被配置用于获得所述神经网络模型中的待量化层,所述待量化层包括多个通道,所述多个通道中的每一个通道具有相应权值;第二获取单元,被配置用于针对所述多个通道中的每一个通道,基于该通道的相应权值,获得该相应权值对应的频域信息中的高频信息;第三获取单元,被配置用于基于所述多...
【专利技术属性】
技术研发人员:李朝林,王志鹏,张凡,
申请(专利权)人:昆仑芯北京科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。