【技术实现步骤摘要】
一种基于现场可编程阵列的量化神经网络加速方法
本专利技术属于图像处理领域,特别涉及一种基于神经网络的图像处理技术。
技术介绍
神经网络(NN)在目标检测、语义分割等许多领域已经取得了不错的效果,但是如何在自动驾驶、自主机器人等实际应用中部署神经网络的人工智能(AI)应用程序是具有挑战性的。这是由于实际应用中的设备一般是资源受限的嵌入式系统,这类系统内存较少且计算能力不足,但是神经网络通常拥有庞大的参数量和计算量,这就要求大量的存储资源和计算资源,资源受限的嵌入式系统是不能够满足的。将神经网络模型低精度量化,可以有效减少存储需求,使用现场可编程门阵列作为协处理器并设计与量化神经网络相匹配的运算电路来加速神经网络的计算,可以减少资源受限的嵌入式系统的计算压力,这样就能够在资源受限的嵌入式系统中部署人工智能应用。近年来,神经网络在各种领域相比于传统算法有了极大的进步。在图像、视频、语音处理领域,各种各样的网络模型被提出,例如卷积神经网络、循环神经网络。训练较好的CNN模型把ImageNet数据集上5类顶尖图像的分类准确率从 ...
【技术保护点】
1.一种基于现场可编程阵列的量化神经网络加速方法,包括以下步骤:/nS1、图像处理的神经网络的每一层表示为计算图,输入和权重经过卷积或者全连接计算之后,加上偏置值,再通过激活函数,得到最后的输出;将权重空间向稀疏的离散空间进行逼近;/nS2、对经步骤S1处理后的权重进行数值量化,得到量化后的图像处理的神经网络;/nS3、设计与量化后的图像处理的神经网络相匹配的加速器;/nS4、量化后的图像处理的神经网络各层根据对应的加速器进行计算,得到图像处理结果。/n
【技术特征摘要】
1.一种基于现场可编程阵列的量化神经网络加速方法,包括以下步骤:
S1、图像处理的神经网络的每一层表示为计算图,输入和权重经过卷积或者全连接计算之后,加上偏置值,再通过激活函数,得到最后的输出;将权重空间向稀疏的离散空间进行逼近;
S2、对经步骤S1处理后的权重进行数值量化,得到量化后的图像处理的神经网络;
S3、设计与量化后的图像处理的神经网络相匹配的加速器;
S4、量化后的图像处理的神经网络各层根据对应的加速器进行计算,得到图像处理结果。
2.根据权利要求1所述的一种基于现场可编程阵列的量化神经网络加速方法,其特征在于,所述步骤S1所述权重空间为连续复杂的实数空间。
3.根据权利要求2所述的一种基于现场可编程阵列的量化神经网络加速方法,其特征在于,稀疏的离散空间为{-1,0,+1}的离散空间。
4.根据权利要求3所述的一种基于现场可编程阵列的量化神经网络加速方法,其特征在于,所述步骤S2包括以下子步骤:
S21、获取权重空间逼近后的神经网络模型,得到近似逼近{-1,0,+1}的权重空间;
S22、定义离散化量化函数;...
【专利技术属性】
技术研发人员:詹瑾瑜,周星志,江维,孙若旭,温翔宇,宋子微,廖炘可,范翥峰,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。