【技术实现步骤摘要】
本专利技术属于神经网络处理,特别涉及一种提升输入层输出16通道的硬件利用率方法。
技术介绍
1、在现有技术中,nna全称neural networks accelerate,在cpu的simd的pipeline上的硬件加速器,操作由特殊的cpu/simd指令控制,在一个线程上运行,用以解决绝大部分的卷积乘加。由于nna本身仅需要配置相关的参数(卷积核大小、输入分辨率、输入通道数等),nna即可自行地进行相关的卷积计算。且nna以mac为基本的计算单元,而每个mac可以方便的计算出1个输出点32通道的卷积结果。
2、在输入层输出通道为16的时候,采取简单的把输出通道填充为32通道,通过这种方式来时快速的使用nna来实现卷积。
3、然而,由于nna的计算单元为1个mac,而每个mac可以方便的计算出1个输出点32通道的卷积结果。那么,上述的方案,简单地把16输出通道填充为32通道。在这种方案下,每个mac的输出点的有效的计算结果只有前16个通道,后16个通道均为无效值,从而产生冗余。
4、此外,现有技术中
...【技术保护点】
1.一种提升输入层输出16通道的硬件利用率方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的一种提升输入层输出16通道的硬件利用率方法,其特征在于,所述NNA的MAC运算的特性中,
3.根据权利要求2所述的一种提升输入层输出16通道的硬件利用率方法,其特征在于,
4.根据权利要求1所述的一种提升输入层输出16通道的硬件利用率方法,其特征在于,所述重排:是把当前输出点对应的KH*KW*IC个输入点按照先通道,宽,高的优先顺序进行重新排列为形状为1*1*P的数据;
【技术特征摘要】
1.一种提升输入层输出16通道的硬件利用率方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的一种提升输入层输出16通道的硬件利用率方法,其特征在于,所述nna的mac运算的特性中,
3.根据权利要求2所述的一种提升输入...
【专利技术属性】
技术研发人员:李岩,王荔枝,
申请(专利权)人:合肥君正科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。