【技术实现步骤摘要】
适用于低资源嵌入式芯片的CNN网络的加速设计方法
本专利技术属于神经网络深度学习
,特别是涉及一种适用于低资源嵌入式芯片的CNN网络的加速设计方法。
技术介绍
卷积神经网络(ConvolutionalNeuralNetwork,CNN)是深度学习
中的一项重要的创新。卷积神经网络作为一种典型的多层神经网络始终处于研究的核心地位。采用的局部连接和权值共享的方式,一方面减少了权值的数量使得网络易于优化,另一方面降低了模型的复杂度,也就是减小了过拟合的风险。因此,CNN被应用在很多的机器视觉相关的任务中,并取得了很大的成功。CNN带来的优异的效果,激发了很多存量的嵌入式设备厂商通过软件升级的方式来对其原有产品进行智能赋能的需求。而当前主流的CNN的计算过程往往需要借助于一些专门的硬件资源才可以实现。比如,目前主要是借助于GPU、FPGA、ASIC这三种硬件资源才能够实现部署。那么,在计算资源和内存资源都比较贫乏的嵌入式芯片上(低资源)如何把CNN网络部署上去,让它尽可能快速高效的运行起来,哪怕是部署相对简化的C ...
【技术保护点】
1.适用于低资源嵌入式芯片的CNN网络的加速设计方法,其特征在于,包括如下步骤:/nS001:对卷积/池化运算的计算方向进行重新的设计,采用以通道方向优先的计算顺序;/nS002:对CNN网络中卷积/池化层的空间分配和计算流程进行优化;/nS003:利用Neon指令集来提升计算性能。/n
【技术特征摘要】
1.适用于低资源嵌入式芯片的CNN网络的加速设计方法,其特征在于,包括如下步骤:
S001:对卷积/池化运算的计算方向进行重新的设计,采用以通道方向优先的计算顺序;
S002:对CNN网络中卷积/池化层的空间分配和计算流程进行优化;
S003:利用Neon指令集来提升计算性能。
2.根据权利要求1所述的适用于低资源嵌入式芯片的CNN网络的加速设计方法,其特征在于,所述步骤S001中采用以通道方向优先的计算顺序,具体计算顺序为:通道→宽度→高度,以一行作为最小的计算单位;只要满足一行的卷积/池化计算的数据要求就可以进行计算,同时只需载入一行数据。
3.根据权利要求1所述的适用于低资源嵌入式芯片的CNN网络的加速设计方法,其特征在于,所述步骤S002中空间分配的优化:对片内SRAM地址空间进行统一的分配管理...
【专利技术属性】
技术研发人员:葛益军,
申请(专利权)人:杭州雄迈集成电路技术股份有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。