一种在处理单元上对神经网络进行量化的方法和设备技术

技术编号：33904759 阅读：12 留言：0更新日期：2022-06-25 18:29

本公开记载了一种用于在处理单元上对神经网络进行量化的方法、电子设备和计算装置，其中计算装置可以包括在组合处理装置中，该组合处理装置还可以包括通用互联接口和其他处理装置。所述计算装置与其他处理装置进行交互，共同完成用户指定的计算操作。组合处理装置还可以包括存储装置，该存储装置分别与计算装置和其他处理装置连接，用于计算装置和其他处理装置的数据。处理装置的数据。处理装置的数据。

全部详细技术资料下载

【技术实现步骤摘要】
一种在处理单元上对神经网络进行量化的方法和设备

[0001]本公开涉及计算机领域，更具体地，涉及神经网络中数据量化的方法。

技术介绍

[0002]Int8量化能明显减少神经网络模型的占用空间和神经网络模型运行时占用的带宽。当前，卷积神经网络的量化过程都是在CPU上进行的：将待量化网络运行在CPU上，在网络运行过程中通过修改待量化算子函数获取所需的参数，并在运行网络时执行量化过程。最终，量化后的卷积神经网络就可以运行在MLU平台上进行应用。但是，上述量化过程有以下四个缺点：一、由于CPU处理卷积神经网络速度很慢，导致当量化中使用的样本过大时，整个量化所耗费的时间会大幅增加；二、对于由多个cnml算子拼接而成的大算子和由Bang c语言实现的算子(一般由用户自定义，框架官方不支持)无法在CPU上运行，导致整个量化无法进行；三、对于多个cnml算子拼接的大算子，待量化的算子可能为其中的某个cnml算子，而网络运行过程又无法拿到相关参数，从而导致该拼接算子无法量化；四、破坏框架结构，并且后续框架有改动量化工具也需要进行修改，提高了维护成本。

技术实现思路

[0003]本公开的技术方案的目的在于提供一种能够对神经网络的节点进行量化的方案。
[0004]根据本公开的第一方面，提供一种在处理单元上对神经网络进行量化的方法，包括：获取所述神经网络的节点；运行所述神经网络以确定节点中的可量化节点，以便于对所述可量化节点的输入进行量化。
[0005]根据本公开的第二方面，提供一种电子设备，包括：一个或多个...

【技术保护点】

【技术特征摘要】
1.一种在处理单元上对神经网络进行量化的方法，包括：获取所述神经网络的节点；运行所述神经网络以确定节点中的可量化节点，以便于对所述可量化节点的输入进行量化。2.根据权利要求1所述的方法，其中，获取所述神经网络的节点包括：接收关于所述神经网络的结构信息；以及从所述结构信息中获取所述神经网络的节点。3.根据权利要求2所述的方法，其中，接收关于所述神经网络的结构信息包括：接收记载所述神经网络的结构的文件，优选地，所述文件为Json文件。4.根据权利要求1所述的方法，其中，运行所述神经网络以确定节点中的可量化节点包括：确定所述节点是否为运算节点；响应于所述节点为运算节点，运行所述神经网络以确定所述运算节点是否为可量化节点，以便于对所述可量化节点的输入进行量化。5.根据权利要求4所述的方法，其中，确定所述节点是否为运算节点包括：确定所述节点名称中是否包含表征运算节点的第一关键字。6.根据权利要求5所述的方法，其中所述第一关键字为“output”。7.根据权利要求4所述的方法，其中，响应于所述节点为运算节点，运行所述神经网络以确定所述运算节点是否为可量化节点包括：响应于所述节点为运算节点，接收数据和权重；运行所述神经网络，以根据所述数据和权重来得到第一输出；根据所述第一输出来确定所述运算节点是否为可量化节点。8.根据权利要求7所述的方法，其中，所述数据来自于外部输入或者来自于上级算子的输出。9.根据权利要求1
‑
8中任意一项所述的方法，其中...

【专利技术属性】
技术研发人员：ꢀ七四专利代理机构，
申请(专利权)人：安徽寒武纪信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人