适合通用硬件电路的神经网络数据存储格式转换方法技术

技术编号：35686159 阅读：15 留言：0更新日期：2022-11-23 14:31

本公开揭示了计算机实现的数据处理方法，包括步骤：S100：从源存储器读取图像数据，其中源存储器具有源存储格式，其中对源存储器的读取是以适用于源存储器的模式进行的；S200：把图像数据从源存储格式转置成不同于源存储格式的目的地存储格式，其中源存储格式和目的地存储格式中的一个是HWC8存储格式，而源存储格式和目的地存储格式中的另一个是HWC88存储格式；S300：把图像数据写入到目的地存储器，其中目的地存储器具有目的地存储格式，其中对目的地存储器的读取是以适用于目的地存储器的格式进行的。本公开利用HWC88存储格式具有更好的局部性，可以提高cache中数据的利用率，进而提升数据传输带宽和计算性能。提升数据传输带宽和计算性能。提升数据传输带宽和计算性能。

全部详细技术资料下载

【技术实现步骤摘要】
适合通用硬件电路的神经网络数据存储格式转换方法

[0001]本公开属于人工智能
，特别涉及一种适合通用硬件电路的神经网络数据存储格式转换方法。

技术介绍

[0002]近些年来随着以卷积神经网络为主导的人工智能技术的发展，越来越多的计算机视觉任务得到了很好的解决，如图像分类，目标检测和语义分割等。并且当前的一个发展趋势是在端侧平台上部署高性能的神经网络模型并能在真实场景中实时(大于30帧)运行，如移动端/嵌入式端设备。这些平台的特点是内存资源少，处理器性能不高，功耗受限，这使得目前精度最高的模型由于对内存和计算资源的超额要求使得根本无法在上面部署且达到实时性的要求。
[0003]在深度学习中，为了提升数据传输带宽和计算性能，会使用NCHW、NHWC和CHWN等数据格式，它们是image或feature map等的逻辑数据格式(数据在内存中的存放顺序)。不同的数据格式可以通过增加局部数据的复用性，提高cache中数据的利用率。在不同的硬件平台上使用不同的数据存储格式直接影响着计算效率，例如TensorFlow中默认的数据格式为NHWC格式，这是因为NHWC格式在CPU平台上相较于NCHW稍快一些，而NCHW则是Nvidia cuDNN默认格式，使用GPU加速时用NCHW格式速度会更快。

技术实现思路

[0004]鉴于此，本公开提供了一种计算机实现的数据处理方法，包括：
[0005]S100：从源存储器读取图像数据，其中所述源存储器具有源存储格式，其中对所述源存储器的读取是以适用于所述...

【技术保护点】

【技术特征摘要】
1.一种计算机实现的数据处理方法，包括：S100：从源存储器读取图像数据，其中所述源存储器具有源存储格式，其中对所述源存储器的读取是以适用于所述源存储器的模式进行的；S200：把所述图像数据从所述源存储格式转置成不同于所述源存储格式的目的地存储格式，其中所述源存储格式和所述目的地存储格式中的一个是HWC8存储格式，而所述源存储格式和所述目的地存储格式中的另一个是HWC88存储格式；S300：把图像数据写入到目的地存储器，其中所述目的地存储器具有所述目的地存储格式，其中对所述目的地存储器的读取是以适用于所述目的地存储器的格式进行的。2.根据权利要求1所述的方法，其中，优选的，HWC88存储格式用于实现FM在数据存储中组织格式的重排，且需要满足如下条件：该格式具有良好的局部性，能提高cache中数据的利用率，以及提升数据传输带宽和计算性能。3.根据权利要求1所述的方法，其中，所述图像数据是神经网络数据。4.根据权利要求1所述的方法，其中，所述图像数据包括FM数据、WT数据、Bias数据和Clip数据。5.根据权利要求1所述的方法，其中，所述步骤S200还进一步包括如下步骤：S201：每次从双倍速率同步动态随机存...

【专利技术属性】
技术研发人员：任鹏举，林晓云，赵文哲，党祺玮，刘汉威，夏天，
申请(专利权)人：西安交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人