【技术实现步骤摘要】
数据处理方法、装置、电子设备及计算机可读存储介质
[0001]本申请涉及数据处理
,具体涉及神经网络
,具体而言,本申请涉及一种数据处理方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]神经网络模型部署于AI加速器,神经网络模型的算子的数量和算子的类型影响AI加速器搬运数据的效率,有的神经网络模型的计算图可能同时具备卷积算子(convolution,Conv)、重塑算子(reshape)以及转置算子(transpose),Conv算子是计算密集型算子,无论怎样都需要进行计算,reshape算子和transpose算子是访存密集型算子,所进行的仅仅是对数据进行重新排列,二者都不进行数据计算,不进行任何数据计算的算子对AI加速器而言较为耗时。
[0003]此外,在进行数据搬运过程中,执行上述卷积算子、重塑算子以及转置算子时,是以卷积算子的输出张量的最后一维度属性为单位进行数据搬运,该最后一维度属性表征的是块大小(block size),块大小通常为2,是一个较小的数值,AI加速器基于块大小为单位进行数据搬运导致数据之间的连续性较低,影响数据搬效率,进而影响神经网络模型的推理性能。
技术实现思路
[0004]本申请实施例提供了一种数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,用于解决
技术介绍
中的技术问题。
[0005]根据本申请实施例的第一方面,提供了一种数据处理方法,该方法包括:
[0006]确定输入样本以及待部署的神经网络模型,神经 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:确定输入样本以及待部署的神经网络模型,所述神经网络模型包括多个算子,所述多个算子的种类包括卷积算子、重塑算子和转置算子;将所述输入样本输入至所述神经网络模型,获得所述神经网络模型中各算子的输入张量和输出张量;若确定所述神经网络模型包括至少一个候选算子集,所述候选算子集依次包括一个第一卷积算子、一个重塑算子和一个转置算子,且所述候选算子集中各算子满足预设条件,则确定所述候选算子集对应的目标算子集;所述目标算子集中依次包括一个第二卷积算子和一个深度至广度算子;其中,所述第二卷积算子和所述第一卷积算子的输入张量相同、输出张量不同,所述第一卷积算子的输出张量的最后一维度属性表征块block大小,所述第二卷积算子的输出张量的最后一维度属性表征输出通道数;所述深度至广度算子和所述转置算子的输出张量相同;将所述神经网络模型中的所述候选算子集替换为所述目标算子集,将替换后的神经网络模型部署于AI加速器。2.根据权利要求1所述的方法,其特征在于,所述目标算子集中的第二卷积算子是通过以下方式确定的:获取所述第一卷积算子的第一权重矩阵、第一偏置项以及所述重塑算子的输出张量;所述重塑算子的输出张量包括六个维度属性,其中,所述重塑算子的输出张量的第四维度属性表征输出通道数;所述重塑算子的输出张量的第五维度属性表征block大小;将所述第一卷积算子的输入张量作为所述第二卷积算子的输入张量,对所述重塑算子的输出张量中的各维度属性进行重排,得到重排后的输出张量,将重排后的输出张量作为第二卷积算子的输出张量;基于所述第一卷积算子的第一权重矩阵、所述重塑算子的输出张量的第四维度属性和第五维度属性生成第二权重矩阵、第二偏置项;将所述第二权重矩阵作为第二卷积算子的权重矩阵,将所述第二偏置项作为所述第二卷积算子的权重矩阵。3.根据权利要求2所述的方法,其特征在于,所述对所述重塑算子的输出张量中的各维度属性进行重排,包括:交换所述重塑算子的输出张量中第四维度属性和第五维度属性的位置;或交换所述重塑算子的输出张量中第四维度属性和第六维度属性的位置;所述重塑算子的输出张量的第四维度属性表征通道数,所述重塑算子的输出张量的第五维度属性和第六维度属性均表征block大小。4.根据权利要求2所述的方法,其特征在于,所述第一卷积算子的第一权重矩阵包括四个维度属性,其中,所述第一权重矩阵的第二维度属性表征图像高度,所述第一权重矩阵的第三维度属性表征图像宽度,所述第一权重矩阵的第四维度属性表征输入通道数;所述基于所述第一卷积算子的第一权重矩阵、所述重塑算子的输出张量的第四维度属性和第五维度属性生成第二权重矩阵、第二偏置项,包括:配置第三权重矩阵的各维度属性,其中,所述第三权重矩阵的第一维度属性为所述重
塑算子的输出张量的第四维度属性所表征的输入通道数;所述第三权重矩阵的第二维度属性和第三维度属性均为所述重塑算子的输出张量的第五维度属性所表征的block大小;所述第三权重矩阵的第四维度属性为所述第一权重矩阵的第二维度属性、第三维度属性和第四维度属性的乘积;基于第一预设重排参数对所述第三权重矩阵的各维度属性进行重排,得到重排后的第三权重矩阵;获取所述第一权重矩阵的矩阵形状,基于所述第一权重矩阵的矩阵形状修改所述重排后的第三权重矩阵的矩阵形状,得到第二权重矩阵;配置第三偏置项的各维度属性,其中,所述第三偏置项的第一维度属性为所述重塑算子的输出张量的第四维度属性所表征的输入通道数;所述第三偏置项的第二维度属性和第三维度属性均为所述重塑算子的输出张量的第五维度属性所表征的block大小;基于第二预设重排参数对所述第三偏置项的各维度属性进行重排,得...
【专利技术属性】
技术研发人员:王旭明,
申请(专利权)人:安谋科技中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。