【技术实现步骤摘要】
一种运行在ARM上的卷积神经网络字符识别方法
本专利技术属于人工智能领域,特别是一种运行在嵌入式设备上的整数卷积神经网络字符识别方法。
技术介绍
通常字符识别的方法分为结构特征识别、统计特征识别和深度学习特征识别三个方向。在结构特征识别中,基于字符结构特征和相交点特征的虚线,形成识别判断树实现字符识别,字符结构往往会产生较大的变化,甚至出现局部断裂粘连等复杂情况。因此采用结构特征识别的方法并没有较好的结果。在统计特征识别中,多采用八方向梯度特征和梯度方向直方图特征,并且采用支持向量机和最近邻分类两种模式识别方法。统计特征相比于结构特征更能表现出不同字符的特性,但是对分辨率很低的情形,统计特征往往很难区别相似字符。在基于深度学习的特征识别时,研究人员得到的结果相比于上面两种方法更加优秀。不同结构的卷积神经网络都取得了较好的结果。然而,在硬件设备上部署基于深度学习的识别方案时,无法同时满足识别精度和实时性两个特性,满足不了时间和精度上的双重需求。
技术实现思路
一种运行在ARM上的卷积神经网络字符识别方法,包括:S100.对输入训练完毕的卷积神经网络,设置每次量化的比例R,按从大到小排序,每次将比例为R的权值量化为2的n次幂;迭代运行上述步骤直到量化后的网络与量化前的网络错误率差别小于设定阈值;S200.输入一组校正样本集,计算权值已量化完毕的卷积神经网络每层输出的激活值。对每层的激活值进行一次性的8位有符号整数量化。进一步地,所述S100包括:S101 ...
【技术保护点】
1.一种运行在ARM上的卷积神经网络字符识别方法,其特征在于,包括:/nS100.对输入训练完毕的卷积神经网络,设置每次量化的比例R,按从大到小排序,每次将比例为R的权值量化为2的n次幂;迭代运行上述步骤直到量化后的网络与量化前的网络错误率差别小于设定阈值;/nS200.输入一组校正样本集,计算权值已量化完毕的卷积神经网络每层输出的激活值,对每层的激活值进行一次性的8位有符号整数量化。/n
【技术特征摘要】
1.一种运行在ARM上的卷积神经网络字符识别方法,其特征在于,包括:
S100.对输入训练完毕的卷积神经网络,设置每次量化的比例R,按从大到小排序,每次将比例为R的权值量化为2的n次幂;迭代运行上述步骤直到量化后的网络与量化前的网络错误率差别小于设定阈值;
S200.输入一组校正样本集,计算权值已量化完毕的卷积神经网络每层输出的激活值,对每层的激活值进行一次性的8位有符号整数量化。
2.如权利要求1所述的一种卷积神经网络权重按照2的幂次量化的方法,其特征在于,所述S100包括:
S101.输入训练完毕的浮点型卷积神经网络、设定每轮量化权重的比例R;
S102.根据运算速度限制和量化精度需求,确定量化权值位数b;初始化与卷积神经网络相同大小的量化标记矩阵,量化标记矩阵为全为1的矩阵Tl;
S103.遍历卷积神经网络中所有权值,获得所有权值中绝对值最大的值记为max(abs(W1)),根据该值获得n2;
S104.根据量化权值位数b和n2,得到全局的最小权值指数值n1;
S105.根据全局的权值指数值n1、n2和权值位数b,得到量化后的权值范围P1;
S106.对卷积神经网络中每一层权值按照绝对值大小进行先大后小的排序,按照量化比例R获得每一层量化阈值T1;
S107.将网络中各层权值绝对值与该层的量化阈值T1相比,如果T1小于当前权值的绝对值,则将其量化为S105中P1里与其最接近的权值;否则,则该权值不变;
S108.输入经步骤S107部分量化的网络与对应的标记矩阵Tl,使用训练数据集对量化网络进行前向传播,计算损失函数;
S109.根据卷积神经网络反向传播算法与S108中计算的损失函数,对部分量化的网络进行逐层梯度计算;
S110.将S109得到的梯度用于更新各层未量化的权值,重复S107-S109训练网络若干轮;
S111.判断当前轮量化比例R,若已经达到100%则停止;否则返回S110继续执行;
S112.输出权值全为2的幂次的量化神经网络。
3.如权利要求1的一种运行在ARM上的卷积神经网络字符识别方法,其特征在于,S103中变量n2获取公式为:
其中,max(abs(W1))为所有权值中绝对值最大的值。
4.如权利要求1的一种运行在ARM上的卷积神经网络字符识别方法,其特征在于,S104中根据量化权值位数b和n2,得到全局的最小权值...
【专利技术属性】
技术研发人员:黄炎,杜飞飞,
申请(专利权)人:武汉卓目科技有限公司,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。