一种提高卷积运算效率的数据摆放方法技术

技术编号：28560514 阅读：19 留言：0更新日期：2021-05-25 17:55

本发明专利技术公开一种提高卷积运算效率的数据摆放方法，包括以下步骤：w方向数据缓存模块从块数据缓存sram中取出特定数量的w方向特征值、h方向特征值和c方向特征值，根据第一预设数目将w方向特征值依次摆放到sram子模块中，根据第二预设数目将h方向特征值依次摆放到sram子模块中，根据第三预设数目将c方向特征值依次摆放到sram子模块中，通过迭代展开为一维数据保存在n个sram子模块中；将sram子模块中的一维数据发送到fifo缓存模块；将一维数据从fifo缓存模块发送到数据拼凑模块，根据filter窗口的尺寸对一维数据进行对应的重排序。本发明专利技术的有益效果是：通过多级缓存加速并重排序需要取进的数据，将数据输入划成更细的输入块，提高卷积的运算效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种提高卷积运算效率的数据摆放方法
本专利技术涉及神经网络加速芯片卷积
，尤其涉及一种提高卷积运算效率的数据摆放方法。
技术介绍
随着人工智能的快速发展，人们对人工智能加速芯片的运算速度的要求也越来越高。而人工智能加速芯片中普遍采用的是神经网络结构，而卷积神经网络又是其核心的一种神经网络类型。在卷积神经网络的实现中，卷积的运算时间占了很大的一部分，所以如何提高卷积的运算效率，成为了提高神经网络加速芯片运算速度的关键。目前也有很多提高卷积运算效率的方法，但从卷积的数据输入的摆放角度还没有更好的方法。
技术实现思路
针对上述问题，本专利技术提出一种提高卷积运算效率的数据摆放方法，旨在改进数据摆放方法，以提高卷积运算效率。为解决上述技术问题，本专利技术的技术方案如下：一种提高卷积运算效率的数据摆放方法，包括以下步骤：w方向数据缓存模块从块数据缓存sram中取出特定数量的w方向特征值、h方向特征值和c方向特征值，根据第一预设数目将所述w方向特征值依次摆放到sram子模块中，根据第二预设数目将所述h方向特征值依次摆放到sram子模块中，根据第三预设数目将所述c方向特征值依次摆放到sram子模块中，通过迭代展开为一维数据保存在n个sram子模块中；将sram子模块中的一维数据发送到fifo缓存模块；将一维数据从fifo缓存模块发送到数据拼凑模块，根据filter窗口的尺寸对所述一维数据进行对应的重排序；其中，w为输入宽度，h为输入高度，c为通道数量，kw为...

【技术保护点】
1.一种提高卷积运算效率的数据摆放方法，其特征在于，包括以下步骤：/nw方向数据缓存模块从块数据缓存sram中取出特定数量的w方向特征值、h方向特征值和c方向特征值，根据第一预设数目将所述w方向特征值依次摆放到sram子模块中，根据第二预设数目将所述h方向特征值依次摆放到sram子模块中，根据第三预设数目将所述c方向特征值依次摆放到sram子模块中，通过迭代展开为一维数据保存在n个sram子模块中；/n将sram子模块中的一维数据发送到fifo缓存模块；/n将一维数据从fifo缓存模块发送到数据拼凑模块，根据filter窗口的尺寸对所述一维数据进行对应的重排序；/n其中，w为输入宽度，h为输入高度，c为通道数量，kw为卷积核的宽度，kh为卷积核的高度，sh为卷积核高度方向的步长，sw为卷积核宽度方向的步长。/n

【技术特征摘要】
1.一种提高卷积运算效率的数据摆放方法，其特征在于，包括以下步骤：
w方向数据缓存模块从块数据缓存sram中取出特定数量的w方向特征值、h方向特征值和c方向特征值，根据第一预设数目将所述w方向特征值依次摆放到sram子模块中，根据第二预设数目将所述h方向特征值依次摆放到sram子模块中，根据第三预设数目将所述c方向特征值依次摆放到sram子模块中，通过迭代展开为一维数据保存在n个sram子模块中；
将sram子模块中的一维数据发送到fifo缓存模块；
将一维数据从fifo缓存模块发送到数据拼凑模块，根据filter窗口的尺寸对所述一维数据进行对应的重排序；
其中，w为输入宽度，h为输入高度，c为通道数量，kw为卷积核的宽度，kh为卷积核的高度，sh为卷积核高度方向的步长，sw为卷积核宽度方向的步长。

2.如权利要求1所述的提高卷积运算效率的数据摆放方法，其特征在于，所述特定数量根据所述摆放的处理速度、kw、kh、c、sw和sh的支持范围，以及平均每个周期要求完成的卷积核乘累加运算组数的最低要求共同决定。

3.如权利要求1所述的提高卷积运算效率的数据摆放方法，其特征在于，所述第一预设数目、所述第二预设数目和所述第三预设数目在迭代过程数目变化或不变化。

4.如权利要求1所述的提高卷积运算效率的数据摆放方法，其特征在于，所述sram子模块和所述fifo缓存模块的数量一致。

5.如权利要求1所述的提高卷积运算效率的数据摆放方法，其特征在于，filter窗口的尺寸包括kw、kh和sh，且定义sw＝1。

6.如权利要求1所述的提高卷积运算效率的数据摆放方法，其特征在于，所述重排序具体为：所述一维数据根据filter窗口的尺寸排序，分为c＝1、c＝4、c＝8和c＝16*n四类，当c＝1，根据kw方向的特征值的不同数目，从每个所述fif...

【专利技术属性】
技术研发人员：不公告发明人，
申请(专利权)人：珠海亿智电子科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人