一种卷积计算中资源共享的方法、装置、介质及设备制造方法及图纸

技术编号：37053179 阅读：18 留言：0更新日期：2023-03-29 19:30

本公开实施例提供的一种基于卷积计算中资源共享的方法、装置、存储介质及电子设备，将任务拆分到不同的处理核中进行卷积计算，降低了对芯片的片内存储空间的消耗，同时，针对不同场景下存在Input Tensor和Weight共享的情况，进一步进行优化，根据不同的共享维度采用对应的拆分方式对输入数据进行拆分，节省处理核的存储空间，提高了数据传输效率，提高了计算单元的并发度，进而提高计算性能。进而提高计算性能。进而提高计算性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种卷积计算中资源共享的方法、装置、介质及设备

[0001]本公开实施例涉及数据处理领域，具体地涉及一种卷积计算中资源共享的方法、装置、介质及设备。

技术介绍

[0002]随着人工智能与深度学习技术的不断发展和普及，应用场景的不断增多，输入数据如图像、雷达、音频等，所占用的内存空间越来越大。但是芯片的片内存储空间有限，一个处理核中的缓存体量已难以存放所有数据。由此，如何优化内存的使用已成为亟待解决的问题。

技术实现思路

[0003]针对现有技术存在的上述问题，本专利技术的目的在于提供一种卷积计算中资源共享的方法、装置、介质及设备，以便于至少部分地解决上述问题。
[0004]根据本公开的一个方面，提出一种卷积计算中资源共享的方法，包括：步骤S1，计算任务拆分成多个可执行的子任务，其中所述子任务以三维坐标Taskid（X，Y，Z）方式表示计算的切分，步骤S2：基于计算任务将输入数据按照预设维度拆分成对应的多个输入子数据，步骤S3：神经网络加速器根据子任务加载所述子数据及权重，并计算得到输出子数据，其中，基于子任务之间对输入数据和权重在所述子任务不同维度的共享情况，对所述输入数据拆分，步骤S4：输出对应的输出子数据。
[0005]在一些实施例中，所述多个可执行子任务以轮询的方式发送至多个所述神经网络加速器，每个所述神经网络加速器可处理多组所述子任务。
[0006]在一些实施例中，所述神经网络加速器具体为张量处理器。
[0007]在一些实施例中，所述子任务具有编号，神经网络加速...

【技术保护点】

【技术特征摘要】
1.一种卷积计算中资源共享的方法，其特征在于，包括：步骤S1，计算任务拆分成多个可执行的子任务，其中所述子任务以三维坐标Taskid（X，Y，Z）方式表示计算的切分，步骤S2：基于计算任务将输入数据按照预设维度拆分成对应的多个输入子数据，步骤S3：神经网络加速器根据子任务加载所述子数据及权重，并计算得到输出子数据，其中，基于子任务之间对输入数据和权重在所述子任务不同维度的共享情况，对所述输入数据拆分，步骤S4：输出对应的输出子数据，所述基于子任务之间对输入数据和权重在所述子任务不同维度的共享情况，对所述输入数据拆分，具体为，对每个输入数据设置对应所述子任务3个维度的Flag（ShardX，SharedY，SharedZ），当SharedX使能且SharedY，SharedZ不使能时，表示输入数据基于Task的Y，Z维度进行拆分，子任务在X维度上共享，当SharedY使能且SharedX，SharedZ不使能时，表示输入数据基于Task的X，Z维度进行划分，子任务在Y维度上共享，当SharedZ使能且SharedX，SharedY不使能时，表示输入数据基于Task的X，Y维度进行划分，子任务在Z维度上共享。2.根据权利要求1所述的方法，其特征在于：所述多个可执行子任务以轮询的方式发送至多个所述神经网络加速器，每个所述神经网络加速器可处理多组所述子任务。3.根据权利要求1所述的方法，其特征在于：所述神经网络加速器具体为张量处理器。4.根据权利要求1所述的方法，其特征在于：所述子任务具有编号，神经网络加速器基于所述子任务的编号加载对应的输入数据和卷积核，并基于所述子任务的编号输出对应的输出子数据。5.根据权利要求1所述的方法，其特征在于：SharedX、SharedY或SharedZ任意两个可组合同时使能，或三者同...

【专利技术属性】
技术研发人员：赖斯龑，张迪，
申请(专利权)人：芯砺智能科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人