一种基于残差卷积神经网络的量化处理方法及装置制造方法及图纸

技术编号：22296079 阅读：43 留言：0更新日期：2019-10-15 05:08

本发明专利技术提供了一种基于残差卷积神经网络的量化处理方法及装置,该方法包括：获取卷积神经网络的第N层输出数据，对第N层输出数据进行第一量化操作以获得第一量化数据，并将第一量化数据输入至卷积神经网络的第N+1层网络；对第一量化数据进行第二量化操作以获得第二量化数据，将第二量化数据保存至存储器；获取卷积神经网络的第N+M层输出数据，并从存储器读取第二量化数据，以及根据卷积神经网络的第N+M层输出数据与第二量化数据进行逐点运算，其中，N、M为正整数。利用上述方法，节省了用于暂存残差网络中输出数据的存储空间，并减少了对存储器的访问，提高了数据的写入写出效率，降低芯片能耗。

A Quantitative Processing Method and Device Based on Residual Convolutional Neural Network

全部详细技术资料下载

【技术实现步骤摘要】
一种基于残差卷积神经网络的量化处理方法及装置
本专利技术属于神经网络计算领域，具体涉及一种基于残差卷积神经网络的量化处理方法及装置。
技术介绍
本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。卷积神经网络(ConvolutionalNeuralNetworks,简称CNN)是目前非常流行的一种深度学习。残差网络(Resnet)是卷积神经网络的一种，其主要思想是在网络中增加了直连通道(HighwayNetwork)的思想。在引入残差网络之前，传统的卷积神经网络或者全连接网络是对输入数据做一个非线性变换。而引入残差网络之后，则允许原始输入信息直接传到后面的层中。由于传统的卷积神经网络或者全连接网络在信息传递的时候或多或少会存在信息丢失，损耗等问题，同时还有导致梯度消失或者梯度爆炸，导致很深的网络无法训练。而残差网络通过直接将输入信息绕道传到输出而保护信息的完整性，且整个网络只需要学习输入、输出差别的那一部分，简化学习目标和难度。图1示出了根据现有技术的残差网络的计算过程的示意图。其中，在第N层与残差网络中用于执行逐点运算的运算层之间可以有一层或多层神经网络层，包括但不限于卷积、池化、放大、缩放。在现有的残差网络计算方案中，为了将第N层计算的输出结果x与第N+M层的输出结果f(x)做逐点运算，其中，N、M均为正整数，需要将第N层的计算结果x保存在存储空间中，进而在计算完第N+M层神经网络之后，再将存储空间中的第N层的输出结果x取出，并与该第N+M层的计算结果进行逐点运算。在实现本专利技术的过程中...

【技术保护点】
1.一种基于残差卷积神经网络的量化处理方法,其特征在于，包括：获取卷积神经网络的第N层输出数据，对所述第N层输出数据进行第一量化操作以获得第一量化数据，并将所述第一量化数据输入至所述卷积神经网络的第N+1层网络；对所述第一量化数据进行第二量化操作以获得第二量化数据，将所述第二量化数据保存至存储器；获取所述卷积神经网络的第N+M层输出数据，并从所述存储器读取所述第二量化数据，以及根据所述卷积神经网络的第N+M层输出数据与所述第二量化数据进行逐点运算，其中，所述N、M为正整数。

【技术特征摘要】
1.一种基于残差卷积神经网络的量化处理方法,其特征在于，包括：获取卷积神经网络的第N层输出数据，对所述第N层输出数据进行第一量化操作以获得第一量化数据，并将所述第一量化数据输入至所述卷积神经网络的第N+1层网络；对所述第一量化数据进行第二量化操作以获得第二量化数据，将所述第二量化数据保存至存储器；获取所述卷积神经网络的第N+M层输出数据，并从所述存储器读取所述第二量化数据，以及根据所述卷积神经网络的第N+M层输出数据与所述第二量化数据进行逐点运算，其中，所述N、M为正整数。2.由权利要求1所述的方法，其特征在于，所述第一量化操作为线性量化操作，所述第二量化操作为非线性量化操作。3.由权利要求1所述的方法，其特征在于，所述根据所述卷积神经网络的第N+M层输出数据与所述第一量化数据进行逐点运算，包括：根据预设量化精度对所述第N+M层输出数据执行第一反量化操作，以获得第一反量化数据；根据所述预设量化精度对所述第二量化数据执行第二反量化操作，以获得与所述第一反量化数据的小数点位置对齐的第二反量化数据；对所述第一反量化数据与所述第二反量化数据执行逐点运算。4.由权利要求1所述的方法，其特征在于，所述根据所述卷积神经网络的第N+M层输出数据与所述第一量化数据进行逐点运算，包括：根据所述第N+M层输出数据的小数点位置对所述第二量化数据进行第三反量化操作，以获得与所述第N+M层输出数据的小数点位置对齐的第三反量化数据；对所述第N+M层输出数据与所述第三反量化数据执行逐点运算。5.由权利要求1所述的方法，其特征在于，所述第一量化操作的量化程度为8bit，所述第二量化操作的量化程度为2～4bit。6.一种基于残差卷积神经...

【专利技术属性】
技术研发人员：徐兵，张楠赓，
申请(专利权)人：杭州嘉楠耘智信息科技有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人