一种神经网络卷积层的高效量化加速方法及硬件电路技术

技术编号:33711640 阅读:35 留言:0更新日期:2022-06-06 08:45
本发明专利技术涉及人工智能计算技术领域,具体涉及一种神经网络卷积层的高效量化加速方法及硬件电路,分别在乘累加计算后设置逐通道乘法计算和逐通道加法计算,包括对输入特征和输出特征进行非对称量化,以确定放缩因子s1、s3和零点z1、z3的值;对每个权重进行独立量化,分别得到s2_k0、s2_k1、s2_k2

【技术实现步骤摘要】
一种神经网络卷积层的高效量化加速方法及硬件电路


[0001]本专利技术涉及人工智能计算
,具体涉及一种神经网络卷积层的高效量化加速方法及硬件电路。

技术介绍

[0002]近年来,人工智能发展迅速,作为人工智能的重要组成部分,深度神经网络在各行业的应用也日益广泛。在边缘端进行网络模型部署的时候,由于边缘端计算性能和功耗的制约,限制了边缘端的网络模型推理性能。因此,在保证计算精度不大幅损失的前提下,设计低位宽、高效率的神经网络加速器成为行业研究的重点。
[0003]目前业界主流的加速器都在8

bit的量化位宽上进行推理,将权重和特征有32

bit浮点数压缩为8

bit,相比于fp32或int16可以带来成倍的算力提升并成倍减少访存带宽压力。
[0004]量化是浮点数据转为定点数据的过程,分非对称量化(uint8)和对称量化(int8)。

技术实现思路

[0005]本专利技术提供针对网络加速的高效量化方法,通过对特征进行非对称量化,对权重进行对称量化,可本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种神经网络卷积层的高效量化加速方法,包括计算原浮点数r、量化后定点数q、量化的放缩因子S以及零点z,所述零点z为原浮点数0对应的量化后的值,计算公式如下:r=s(q

z);z);z);原浮点数据计算可表示为:r3=∑r1 x r2;其中,r1为输入特征浮点数,r2为权重浮点数,r3为输出特征浮点数,转化为定点运算公式如下:s3(q3

z3)=∑s1(q1

z1)
×
s2(q2

z2)公式转化:展开如下:其特征在于,分别在乘累加计算后设置逐通道乘法计算和逐通道加法计算,包括:对输入特征和输出特征进行非对称量化,以确定放缩因子s1、s3和零点z1、z3的值;对每...

【专利技术属性】
技术研发人员:蔡文利戴波孙皓
申请(专利权)人:北京宏景智驾科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1