张量数据分块存取的方法及装置制造方法及图纸

技术编号：23985600 阅读：31 留言：0更新日期：2020-04-29 13:22

公开了一种张量数据分块存取的方法及装置。包括：依次读取张量数据的多个数据块；对所述数据块进行压缩，以获得压缩数据块；以及，将所述压缩数据块存储到存储器中与所述压缩数据块对应的预定存储空间中。通过该方法能够显著减少张量数据计算时对数据传输带宽的需求，从而在较低的硬件成本下高效的执行张量数据的存取。

Method and device of block access for tensor data

全部详细技术资料下载

【技术实现步骤摘要】
张量数据分块存取的方法及装置
本申请涉及一种张量数据分块存取的方法及装置。
技术介绍
对张量数据执行计算时，需要从较大容量的存储器(比如，作为内存的DDR)中读取该张量数据并存入高速存储器(比如，SRAM)，但因张量数据较大以及高速存储器存储空间的限制，需要对张量数据执行分批计算。为节省存储空间同时降低对数据传输带宽的需求，在对张量数据执行计算之前需要先将张量数据压缩再存储至存储器中(比如，作为内存的DDR)。对张量数据执行计算时，每次计算都需要按照该张量数据压缩时的粒度从存储器中读取数据。但由于张量数据压缩时的粒度过大，远超过每次计算时需读取数据的数量，导致每次计算时无法按照计算所需数据的粒度来进行读取，而是每次计算都需要读取远超过计算所需的数据，这样，对张量数据的压缩不仅未能节省对数据传输带宽的需求，反而给有限的数据传输带宽带来了更大的负担，对存储器、高速存储器等硬件资源的性能需求更高，消耗也更大，同时还会降低整个张量数据的存取效率。因此，需要一种张量数据的分块压缩存取方案，以减少张量数据计算时对数据传输带宽的需求，从而在较低的硬件成本下高效的执行张量数据的存取。
技术实现思路
为了解决上述技术问题，提出了本申请。本申请的实施例提供了一种张量数据分块存取的方法及装置。根据本申请的一个方面，提供了一种张量数据分块存取方法，包括：依次读取张量数据的多个数据块；对所述数据块进行压缩，以获得压缩数据块；以及将所述压缩数据块存储到存储器中与所述压缩数据块对应的预定...

【技术保护点】
1.一种张量数据分块存取方法，包括：/n依次读取张量数据的多个数据块；/n对所述数据块进行压缩，以获得压缩数据块；以及/n将所述压缩数据块存储到存储器中与所述压缩数据块对应的预定存储空间中。/n

【技术特征摘要】
1.一种张量数据分块存取方法，包括：
依次读取张量数据的多个数据块；
对所述数据块进行压缩，以获得压缩数据块；以及
将所述压缩数据块存储到存储器中与所述压缩数据块对应的预定存储空间中。

2.根据权利要求1所述的方法，其中，所述多个数据块是在至少一个维度上对所述张量数据进行划分而获得的。

3.根据权利要求1所述的方法，其中，对所述数据块进行压缩包括：
生成所述数据块的索引，所述索引用于指示所述数据块中的各个数据是否为预定值；以及
删除所述数据块中取值为所述预定值的数据，以获得压缩数据；
其中，所述压缩数据块包括所述索引和所述压缩数据。

4.根据权利要求2所述的方法，还包括：
在所述存储器中为所述压缩数据块分配所述预定存储空间；
其中，与所述张量数据的多个压缩数据块对应的多个预定存储空间是彼此连续的。

5.根据权利要求4所述的方法，其中，为各个压缩数据块分配的所述预定容量是彼此相等的。

6.根据权利要求1所述的方法，其中，相邻数据块的边缘部分彼此重叠，并且在一维度上相邻的两个数据块的重叠区域的大小由用于对该数据块执行卷积运算的卷积核在该维度上的大小确定。

7.根据权利要求6所述的方法，其中，每个数据块在所述至少一个维度上的粒度等于基础值加上所述重叠区域的大小的一半，所述基础值由以所述张量数据作为输出的神经网络的层在该维度上的输出粒度与以所述张量数据作为输入的神经网络的层在该维度上的输入粒度确定。

8.根据权利要求1所述的方法，其中，每个数据块在所述至少一个维度上的粒度由以所述张量数据作为输出的神经网络的层在该维度上的输出粒度与以所述张量数据作为输入的神经网络的层在该维度上的输入粒度确定。

9.一种张量数据分块存取方法，包括：
基于要读取的张量数据的至少一部分的维度坐标，确定存储...

【专利技术属性】
技术研发人员：孙晨，王振江，
申请(专利权)人：北京地平线机器人技术研发有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人