数据处理方法、装置、设备和可读存储介质制造方法及图纸

技术编号：34789038 阅读：27 留言：0更新日期：2022-09-03 19:52

本申请提供一种数据处理方法、装置、设备和可读存储介质，该方法包括：获取待处理的输入特征图和原始输出通道的数量；当所述原始输出通道的数量小于矩阵乘引擎的列数量时，将每个所述原始输出通道进行扩展处理，得到多个扩展后的输出通道；根据所述多个扩展后的输出通道在所述矩阵乘引擎中处理所述输入特征图，得到输出特征图。本申请可使每个原始输出通道每周期生成多个输出，进而提高矩阵乘引擎的利用率。率。率。

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法、装置、设备和可读存储介质

[0001]本申请涉及计算机
，具体而言，涉及一种数据处理方法、装置、设备和可读存储介质。

技术介绍

[0002]通用矩阵乘（general matrix
‑
matrix multiplication，GEMM）是深度学习的核心操作之一，广泛应用于卷积（convolution），全连接(full connection)，以及矩阵乘(matmul)等算子的实现。
[0003]在各种实现方式中，矩阵乘法可以通过使用执行点积运算的硬件（例如，矩阵乘引擎）来执行。换句话说，矩阵乘引擎可以用来计算卷积的不同变体。在各种实施例中，矩阵乘引擎需要足够大的输入（例如，足够大的输入通道和输出通道）才能高效。输入不够大会导致利用率低。
[0004]当输入通道和/或输出通道的数量小于矩阵乘引擎被配置用于的指定大小时，矩阵乘引擎的整体效率会下降。而卷积的输出是神经网络中一层的输出，并且该输出被馈送到下一层。因此对于多层具有有限输入通道和/或输出通道的神经网络，如何提高矩阵乘引擎的效率，尤为重要。

技术实现思路

[0005]本申请实施例的目的在于提供一种数据处理方法、装置、设备和可读存储介质，提升了矩阵乘引擎的效率，从而提高了资源利用率。
[0006]本申请实施例第一方面提供了一种数据处理方法，包括：获取待处理的输入特征图和原始输出通道的数量；当所述原始输出通道的数量小于矩阵乘引擎的列数量时，将每个所述原始输出通道进行扩展处理，得到多个扩展...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，其特征在于，包括：获取待处理的输入特征图和原始输出通道的数量；当所述原始输出通道的数量小于矩阵乘引擎的列数量时，将每个所述原始输出通道进行扩展处理，得到多个扩展后的输出通道；根据所述多个扩展后的输出通道在所述矩阵乘引擎中处理所述输入特征图，得到输出特征图。2.根据权利要求1所述的方法，其特征在于，所述当所述原始输出通道的数量小于矩阵乘引擎的列数量时，将每个所述原始输出通道进行扩展处理，得到多个扩展后的输出通道，包括：当所述原始输出通道的数量小于矩阵乘引擎的列数量时，将每个所述原始输出通道沿着行方向和列方向扩展，并在扩展出来的行列中补充特定元素，得到每个所述原始输出通道对应的所述多个扩展后的输出通道。3.根据权利要求2所述的方法，其特征在于，所述将每个所述原始输出通道沿着行方向和列方向扩展，并在扩展出来的行列中补充特定元素，得到每个所述原始输出通道对应的所述多个扩展后的输出通道，包括：根据所述原始输出通道的核宽度、沿着行方向的步长以及沿核宽度方向的扩展参数，确定所述扩展后的输出通道的核宽度；根据所述原始输出通道的核高度、沿着列方向的步长以及沿核高度方向的扩展参数，确定所述扩展后的输出通道的核高度；按照所述扩展后的输出通道的核宽度和扩展后的输出通道的核高度，构建多个扩展后的输出通道，并在扩展出来的行列中补充特定元素。4.根据权利要求1所述的方法，其特征在于，所述根据所述多个扩展后的输出通道在所述矩阵乘引擎中处理所述输入特征图，得到输出特征图，包括：根据所述输出特征图的限定参数、输入通道参数和所述多个扩展后的输出通道的参数，将所述输入特征图进行图像到列的转换，得到输入矩阵；根据所述输入通道参数和所述多个扩展后的输出通道的参数，将核数据进行图像到列的转换，得到核矩阵；将所述输入矩阵和所述核矩阵输入至所述...

【专利技术属性】
技术研发人员：王平，王刚，
申请(专利权)人：上海登临科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人