数据处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37245587 阅读:18 留言:0更新日期:2023-04-20 23:25
本发明专利技术公开了一种数据处理方法、装置、电子设备及存储介质,其中方法包括:获取神经网络的第i个卷积层生成的第一特征图数据;对第一特征图数据进行有损压缩,获得压缩数据;响应于神经网络的第j个卷积层使用第一特征图数据进行处理,获取压缩数据;对压缩数据进行解压缩,获得第i个卷积层对应的第二特征图数据;确定第一特征图数据与第二特征图数据之间的差异;在根据第二特征图数据对神经网络的第j个卷积层进行处理时,根据差异调节神经网络的可变参数。由此,既能通过有损压缩提高神经网络的压缩比,又能通过调节可变参数保证神经网络的推理精度,实现了模型推理精度与压缩比的良好平衡。良好平衡。良好平衡。

【技术实现步骤摘要】
数据处理方法、装置、电子设备及存储介质


[0001]本专利技术涉及芯片
,尤其涉及一种数据处理方法、装置、电子设备及存储介质。

技术介绍

[0002]以CNN(Convolutional Neural Networks,卷积神经网络)、RNN(Recurrent Neural Network,循环神经网络)等为代表的DL(Deep Learning,深度学习)算法在机器视觉、自然语言处理、自动驾驶、机器人、数据分析等领域中得到了广泛的应用,然而其复杂的结构导致即使在推理时也需要占用大量的功耗和计算资源(如CPU、内存、存储空间等),严重限制了此类技术在功耗和资源受限的移动和嵌入式平台上的部署,因而在此之前需要对模型的权值和特征图进行压缩,并在在目标平台上对模型进行推理的过程中动态地对权值和特征图进行解码并进行运算,以此来达到降低各项资源占用的目的。
[0003]但是目前的模型编码技术主要是对模型的权值和特征图进行无损编码,常用的方法为霍夫曼编码,此种无损编码方式的主要缺点是特征图和权值的压缩比不高。

技术实现思路

本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取神经网络的第i个卷积层生成的第一特征图数据,其中,i为正整数;对所述第一特征图数据进行有损压缩,获得压缩数据;响应于所述神经网络的第j个卷积层使用所述第一特征图数据进行处理,获取所述压缩数据,其中,j为正整数;对所述压缩数据进行解压缩,获得所述第i个卷积层对应的第二特征图数据;确定所述第一特征图数据与所述第二特征图数据之间的差异;在根据所述第二特征图数据对所述神经网络的第j个卷积层进行处理时,根据所述差异调节所述神经网络的可变参数。2.如权利要求1所述的数据处理方法,其特征在于,所述第一特征图数据为所述第i个卷积层生成的第一浮点特征图。3.如权利要求2所述的数据处理方法,其特征在于,对所述第一特征图数据进行有损压缩,包括:确定所述神经网络的第i个卷积层的特征图分布参数;根据所述第i个卷积层的特征图分布参数对所述第i个卷积层生成的第一浮点特征图进行量化,获得所述第i个卷积层的第一整数特征图;对所述第i个卷积层的第一整数特征图进行有损压缩。4.如权利要求3所述的数据处理方法,其特征在于,对所述压缩数据进行解压缩,包括:对所述压缩数据进行解压缩,获得所述第i个卷积层的第二整数特征图;根据所述第i个卷积层的特征图分布参数对所述第i个卷积层的第二整数特征图进行转换,获得所述第i个卷积层的第二浮点特征图,并将所述第i个卷积层的第二浮点特征图作为所述第i个卷积层对应的第二特征图数据。5.如权利要求1

4中任一项所述的数据处理方法,其特征在于,根据所述差异调节所述神经网络的可变参数,包括:根据所述差异对所述神经网络进行反向传播,以获得修正参数;根据所述修正参数调节所述神经网络的可变参数。6.如权利要求5所述的数据处理方法,其特征在于,所述修正参数包括修正权值。7.如权利要求1所述的数据处理方法,其特征在于,...

【专利技术属性】
技术研发人员:孙亚锋
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1