【技术实现步骤摘要】
一种ResNet加速器残差块的数据流优化方法
[0001]本专利技术涉及电子信息以及深度学习
,更具体地,涉及一种ResNet加速器残差块的数据流优化方法。
技术介绍
[0002]卷积神经网络(CNN)算法在人工智能领域中应用最为广泛的算法,广泛应用于安防、自动驾驶、计算机视觉等领域。CNN本质上是一个多层感知机,其成功的原因关键在于它所采用的局部连接和共享权值的方式,一方面减少了的权值的数量使得网络易于优化,另一方面降低了过拟合的风险。CNN是神经网络中的一种,它的权值共享网络结构使之更类似于生物神经网络,降低了网络模型的复杂度,减少了权值的数量。该优点在网络的输入是多维图像时表现的更为明显,使图像可以直接作为网络的输入,避免了传统识别算法中复杂的特征提取和数据重建过程。
[0003]但是,卷积神经网络在达到了非常高的精度的同时,也需要更多的计算资源与内存资源,也导致许多基于卷积神经网络的应用都必须依赖于大型服务器。在资源受限的嵌入式平台,应用卷积神经网络等深度学习技术已经大势所趋。卷积神经网络中通常包含着大 ...
【技术保护点】
【技术特征摘要】
1.一种ResNet加速器残差块的数据流优化方法,所述ResNet加速器包括若干残差块,所述若干残差块依次连接,其特征在于,包括:残差块每隔ΔT个时钟周期,接收来自上一个残差块的输出数据,所述残差块包括主干通路、支路和瓶颈单元;残差块将接收到的数据存储在残差块主干通路中的第一个卷积处理单元中,经残差块主干通路中的若干卷积处理单元处理后送入瓶颈单元中;等下一个ΔT个时钟周期后新的数据到来前,再把存储在残差块主干通路中的第一个卷积处理单元中的数据传输至残差块支路中处理后,送入瓶颈单元中;瓶颈单元的输出即为残差块的输出并输出至下一个残差块中。2.根据权利要求1所述的ResNet加速器残差块的数据流优化方法,其特征在于,所述残差块接收的数据是以输入特征图行数据为单位。3.根据权利要求1所述的ResNet加速器残差块的数据流优化方法,其特征在于,所述残差块的主干通路包括3个卷积处理单元,所述主干通路的3个卷积处理单元依次连接,所述主干通路的3个卷积处理单元中最后一个卷积处理单元的输出与瓶颈单元连接。4.根据权利要求3所述的ResNet加速器残差块的数据流优化方法,其特征在于,所述卷积处理单元均包括卷积数据缓存器和运算单元,所述卷积数据缓存器用于存储当前输入特征图的行数据,所述运算单元根据所述卷积数据缓存器存储的输入特征图的行数据,进行卷积运算,运算时间为ΔT。5.根据权利要求4所述的R...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。