数据处理方法和装置制造方法及图纸

技术编号：29060121 阅读：16 留言：0更新日期：2021-06-30 09:02

本说明书实施例提供一种数据处理方法和装置，将第一输入数据中的第一输入数据块和第二输入数据中的第二输入数据块从内存直接加载到寄存器，再对寄存器中的第一输入数据块和第二输入数据块进行矩阵乘法处理；其中，所述第一输入数据的宽度远小于所述第二输入数据的宽度。的宽度。的宽度。

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法和装置

[0001]本公开涉及数据处理
，尤其涉及数据处理方法和装置。

技术介绍

[0002]矩阵乘法处理在许多高性能计算场景中有着极其重要的地位。例如在目前得到广泛运用的卷积神经网络(Convolutional Neural Networks，CNN)中，有很大一部分的耗时来源于进行矩阵乘法处理所带来的耗时。因此，优化矩阵乘法的性能对于优化高性能计算的耗时有着重要意义。

技术实现思路

[0003]本公开提供一种数据处理方案。
[0004]根据本公开实施例的第一方面，提供一种数据处理方法，所述方法包括：将第一输入数据中的第一输入数据块从内存加载到第一寄存器；将第二输入数据中的第二输入数据块从所述内存加载到第二寄存器；对所述第一寄存器中的所述第一输入数据块与所述第二寄存器中的所述第二输入数据块进行矩阵乘法处理，得到输出数据的输出数据块；其中，所述第一输入数据的宽度远小于所述第二输入数据的宽度。
[0005]在一些实施例中，所述将第二输入数据中的第二输入数据块从所述内存加载到第二寄存器，包括：基于指向所述内存中的第一目标地址的第一指针，将所述第一目标地址中存储的第一元素加载到所述第二寄存器，其中，所述第一元素为所述第二输入数据块中第j行最后一个元素；将读指针由所述第一指针跳转至指向所述内存中的第二目标地址的第二指针，其中，所述第二指针与所述第一指针之间的距离为所述第二输入数据的行数与所述第二输入数据块的行数之差；基于所述第二指针，将所述第二目标地址存储的第二元素加载到所述...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，其特征在于，所述方法包括：将第一输入数据中的第一输入数据块从内存加载到第一寄存器；将第二输入数据中的第二输入数据块从所述内存加载到第二寄存器；对所述第一寄存器中的所述第一输入数据块与所述第二寄存器中的所述第二输入数据块进行矩阵乘法处理，得到输出数据的输出数据块；其中，所述第一输入数据的宽度远小于所述第二输入数据的宽度。2.根据权利要求1所述的方法，其特征在于，所述将第二输入数据中的第二输入数据块从所述内存加载到第二寄存器，包括：基于指向所述内存中的第一目标地址的第一指针，将所述第一目标地址中存储的第一元素加载到所述第二寄存器，其中，所述第一元素为所述第二输入数据块中第j行最后一个元素；将读指针由所述第一指针跳转至指向所述内存中的第二目标地址的第二指针，其中，所述第二指针与所述第一指针之间的距离为所述第二输入数据的行数与所述第二输入数据块的行数之差；基于所述第二指针，将所述第二目标地址存储的第二元素加载到所述第二寄存器。3.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：将所述输出数据块存储至第三寄存器；将所述第三寄存器中的输出数据块加载到所述内存。4.根据权利要求3所述的方法，其特征在于，所述将所述第三寄存器中的输出数据块加载到所述内存，包括：基于指向所述内存中的第三目标地址的第三指针，将所述输出数据块第m行的最后一个元素从所述第三寄存器存储到所述第三目标地址；将写指针由所述第三指针跳转至指向所述内存中的第四目标地址的第四指针，其中，所述第三目标地址与所述第四目标地址之间的距离为所述输出数据的行数与所述输出数据块的行数之差；基于所述第四指针，将所述输出数据块第m+1行的第一个元素从所述第三寄存器存储到所述第四目标地址。5.根据权利要求1至4任意一项所述的方法，其特征在于，所述第一输入数据的高度远小于所述第二输入数据的宽度。6.根据权利要求1至5任意一项所述的方法，其特征在于，所述第一输入数据为神经网络的卷积核参数，所述第二输入数据为图像的特征图。7.一种数据处理装置，其特征在于，所述装置包括：第一加载模块，用于将第一输入数据中的第一输入数据块从内存加载到第一寄存器；第二加载模块，用于将第二输入数据中的第二输入数据块从所述内存加载到第二寄存器；处理模块，用于对...

【专利技术属性】
技术研发人员：陈凯亮，
申请(专利权)人：上海商汤智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人