一种用于神经网络推理加速的低功耗浮点乘累加运算方法技术

技术编号：35686180 阅读：14 留言：0更新日期：2022-11-23 14:31

本公开揭示了一种用于神经网络推理加速的低功耗浮点乘累加运算方法，通过对输入的浮点数进行预处理，在计算前对小数部分进行舍入并调整其指数位，对可能会被舍入的数据进行预先的舍入和规整，省去对不必要精度的计算。同时，为了累加电路能够快速执行，采用科学技术法表示的指数的小数部分放弃原有的原码表示方法，转而采用补码表示方法。本公开利用乘累加运算的特点，使用消耗资源较少的定点运算资源实现接近浮点运算的精度，从而解决了神经网络推理过程中计算精度与硬件实现复杂度的平衡问题。衡问题。衡问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于神经网络推理加速的低功耗浮点乘累加运算方法

[0001]本公开属于处理器和计算
，特别涉及一种用于神经网络推理加速的低功耗浮点乘累加运算方法。

技术介绍

[0002]随着人工智能算法的突破，以深度卷积神经网络为代表的推理算法广泛应用于各行各业。然而深度卷积神经网络对算力的需求极高，传统的CPU无法提供足够的算力；GPU虽然能够提供足够的算力，但性能功耗比太低，并不是移动端设备的最佳选择。
[0003]学术界和工业界提出了大量专用的神经网络加速器NPU来解决上述问题。深度卷积神经网络对数据精度不敏感，在良好的量化算法支持下，采用定点运算可以在数据动态范围不大的情况下实现接近浮点的精度。NPU设计按照运算数据精度可以划分为2种类型：一种是处理浮点数据的神经网络加速器，以英伟达公司的移动端GPU为代表，虽然其网络部署方便，但是功耗指标不理想；另一种是处理定点数据的神经网络加速器，由于采用定点运算代替复杂的浮点运算，其性能功耗比非常高，但是网络部署时必须经过专门的量化过程，且精度和动态范围受限。
[0004]因此，如何平衡神经网络加速器采用浮点运算的精度优势与采用定点运算的能量优势，是一个亟待解决的关键问题。

技术实现思路

[0005]鉴于此，本公开提供了一种用于神经网络推理加速的低功耗浮点乘累加运算方法，其特征在于：
[0006]通过对输入的浮点数进行预处理，在计算前对小数部分进行舍入并调整其指数位，对可能会被舍入的数据进行预先的舍入和规整，省去对不必要精度的计算。同时...

【技术保护点】

【技术特征摘要】
1.一种用于神经网络推理加速的低功耗浮点乘累加运算方法，其特征在于：通过对输入的浮点数进行预处理，在计算前对小数部分进行舍入并调整其指数位，对可能会被舍入的数据进行预先的舍入和规整，省去对不必要精度的计算；同时，为了累加电路能够快速执行，采用科学技术法表示的指数的小数部分放弃原有的原码表示方法，转而采用补码表示方法。2.根据权利要求1所述的方法，其中，优选的，所述方法的方案1具体为：对于A组数据的指数位序列(n0，n1，...n7)，取其中的最大值N＝max(n0，n1，...n7)，为A组数据的统一指数位，近似后的A组数据用表示，中的每个数据为：其中α
i
是根据统一的指数位N，将a
i
向右移位得到的，针对每个a
i
，需要右移的位数为η
i
,而η
i
＝N
‑
n
i
；在较为极端的情况下，当η
i
≥8时，α
i
会因为移位变为0；对于每个a
i
，都有η
i
位的数据被直接舍弃；同理，对数组W也做相同处理，近似后的数组为中的每个数据为：其中M＝max(m0，m1，
…
m7)，ω
i
是根据M将w
i
向右移μ
i
位得到的，其中，μ
i
＝M
‑
m
i
；在转换后，α
i
和ω<...

【专利技术属性】
技术研发人员：赵文哲，胡康，张景铭，付格林，夏天，任鹏举，
申请(专利权)人：西安交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人