一种图像处理方法及芯片、存储介质技术

技术编号:36547015 阅读:6 留言:0更新日期:2023-02-04 16:59
本申请实施例公开了一种图像处理方法及芯片、存储介质,图像处理芯片中部署有预设的卷积神经网络模型,卷积神经网络模型包括:深度可分离卷积算子和除法算子,方法包括:在生成待处理图像对应的特征图的情况下,按照深度可分离卷积算子的卷积核尺寸,将特征图划分成至少一个平均池化单元;利用深度可分离卷积算子和除法算子对至少一个平均池化单元进行平均池化处理,得到特征图的平均池化结果。得到特征图的平均池化结果。得到特征图的平均池化结果。

【技术实现步骤摘要】
一种图像处理方法及芯片、存储介质


[0001]本申请实施例涉及图像处理
,尤其涉及一种图像处理方法及芯片、存储介质。

技术介绍

[0002]池化(Pooling),是卷积神经网络中一个重要的算子,用于对特征图进行非线性形式的降采样。
[0003]平均池化(Average Pooling)池化操作中应用较为广泛的一种,其主要根据滑动窗口在特征图上滑动,从而将特征图划分为若干个矩形块,再对每个矩形块输出所有元素的平均值。
[0004]目前,在不支持平均池化算子的硬件平台上,包含平均池化算子的卷积神经网络模型无法直接运行,在此情况下,通常将模型根据平均池化算子进行切分。如图1所示,对于一个卷积神经网络模型,包括2个卷积算子、1个平均池化算子,以及2个全连接算子,可以将其进行切分为3个子图,其中,子图0和子图2所示部分可以部署在网络处理器上运行,子图1所示部分,即平均池化算子部署到中央处理器上运行。
[0005]然而,上述方法虽然能够达到运行整个模型的目的,但是由于网络被切分成多个子网络并部署在不同的芯片上运行,必然会增加内存搬移开销,导致模型处理效率低下。

技术实现思路

[0006]本申请实施例提供一种图像处理方法及芯片、存储介质,提高了模型处理效率。
[0007]本申请实施例的技术方案是这样实现的:
[0008]本申请实施例提供了一种图像处理方法,应用于图像处理芯片,所述图像处理芯片中部署有预设的卷积神经网络模型,所述卷积神经网络模型包括:深度可分离卷积算子和除法算子,所述方法包括:
[0009]在生成待处理图像对应的特征图的情况下,按照所述深度可分离卷积算子的卷积核尺寸,将所述特征图划分成至少一个平均池化单元;
[0010]利用所述深度可分离卷积算子和所述除法算子对所述至少一个平均池化单元进行平均池化处理,得到所述特征图的平均池化结果。
[0011]在上述方法中,所述按照所述深度可分离卷积算子的卷积核尺寸,将所述特征图划分成至少一个平均池化单元,包括:
[0012]将所述特征图,划分成至少一个与所述卷积核尺寸相同的部分;
[0013]将划分出的每个部分确定为一个平均池化单元,得到所述至少一个平均池化单元。
[0014]在上述方法中,所述利用所述深度可分离卷积算子和所述除法算子对所述至少一个平均池化单元进行平均池化处理,得到所述特征图对应的平均池化结果,包括:
[0015]利用所述深度可分离卷积算子,对所述至少一个平均池化单元中每个平均池化单
元内的元素进行求和,得到至少一个求和结果;
[0016]利用所述除法算子,对所述至少一个求和结果中每个求和结果分别进行均值处理,得到所述特征图的平均池化结果。
[0017]在上述方法中,所述利用所述深度可分离卷积算子,对所述至少一个平均池化单元中每个平均池化单元内的元素进行求和,得到至少一个求和结果,包括:
[0018]将所述至少一个平均池化单元中,每个平均池化单元与所述深度可分离卷积算子进行卷积,得到至少一个卷积结果;
[0019]将所述至少一个卷积结果中,每个卷积结果确定为一个求和结果,得到所述至少一个求和结果。
[0020]在上述方法中,所述深度可分离卷积算子的卷积核参数为1。
[0021]在上述方法中,所述利用所述除法算子,对所述至少一个求和结果中每个求和结果分别进行均值处理,得到所述特征图的平均池化结果,包括:
[0022]利用所述除法算子,分别确定所述至少一个求和结果中,每个求和结果除以所述至少一个平均池化单元中对应平均池化单元内元素的数量,得到至少一个均值;
[0023]将所述至少一个均值中每个均值作为一个元素,组成所述特征图的平均池化结果。
[0024]在上述方法中,所述卷积神经网络模型还包括:特征提取卷积算子,所述方法还包括:
[0025]利用所述特征提取卷积算子,对所述待处理图像进行特征提取,得到所述特征图。
[0026]本申请实施例提供了一种图像处理芯片,所述图像处理芯片中部署有预设的卷积神经网络模型,所述卷积神经网络模型包括:深度可分离卷积算子和除法算子,所述图像处理芯片包括:
[0027]单元划分模块,用于在生成待处理图像对应的特征图的情况下,按照所述深度可分离卷积算子的卷积核尺寸,将所述特征图划分成至少一个平均池化单元;
[0028]平均池化模块,用于利用所述深度可分离卷积算子和所述除法算子对所述至少一个平均池化单元进行平均池化处理,得到所述特征图的平均池化结果。
[0029]在上述芯片中,所述单元划分模块,具体用于将所述特征图,划分成至少一个与所述卷积核尺寸相同的部分;将划分出的每个部分确定为一个平均池化单元,得到所述至少一个平均池化单元。
[0030]在上述芯片中,所述平均池化单元,具体用于利用所述深度可分离卷积算子,对所述至少一个平均池化单元中每个平均池化单元内的元素进行求和,得到至少一个求和结果;利用所述除法算子,对所述至少一个求和结果中每个求和结果分别进行均值处理,得到所述特征图的平均池化结果。
[0031]在上述芯片中,所述平均池化单元,具体用于将所述至少一个平均池化单元中,每个平均池化单元与所述深度可分离卷积算子进行卷积,得到至少一个卷积结果;将所述至少一个卷积结果中,每个卷积结果确定为一个求和结果,得到所述至少一个求和结果。
[0032]在上述芯片中,所述深度可分离卷积算子的卷积核参数为1。
[0033]在上述芯片中,所述平均池化单元,具体用于利用所述除法算子,分别确定所述至少一个求和结果中,每个求和结果除以所述至少一个平均池化单元中对应平均池化单元内
元素的数量,得到至少一个均值;将所述至少一个均值中每个均值作为一个元素,组成所述特征图的平均池化结果。
[0034]在上述芯片中,所述卷积神经网络模型还包括:特征提取卷积算子,所述图像处理芯片还包括:特征图确定单元,用于利用所述特征提取卷积算子,对所述待处理图像进行特征提取,得到所述特征图。
[0035]本申请实施例提供了一种图像处理芯片,所述图像处理芯片中部署有预设的卷积神经网络模型,所述卷积神经网络模型包括:深度可分离卷积算子和除法算子,所述图像处理芯片包括处理器、存储器和通信总线;
[0036]所述通信总线,用于实现所述处理器和所述存储器之间的通信连接;
[0037]所述处理器,用于执行所述存储器中存储的一个或多个程序,以实现上述图像处理方法。
[0038]本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述图像处理方法。
[0039]本申请实施例提供了一种图像处理方法及芯片、存储介质,图像处理芯片中部署有预设的卷积神经网络模型,卷积神经网络模型包括:深度可分离卷积算子和除法算子,方法包括:在生成待处理图像对应的特征图的情况下,按照深度可分离卷积算子本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法,应用于图像处理芯片,其特征在于,所述图像处理芯片中部署有预设的卷积神经网络模型,所述卷积神经网络模型包括:深度可分离卷积算子和除法算子,所述方法包括:在生成待处理图像对应的特征图的情况下,按照所述深度可分离卷积算子的卷积核尺寸,将所述特征图划分成至少一个平均池化单元;利用所述深度可分离卷积算子和所述除法算子对所述至少一个平均池化单元进行平均池化处理,得到所述特征图的平均池化结果。2.根据权利要求1所述的方法,其特征在于,所述按照所述深度可分离卷积算子的卷积核尺寸,将所述特征图划分成至少一个平均池化单元,包括:将所述特征图,划分成至少一个与所述卷积核尺寸相同的部分;将划分出的每个部分确定为一个平均池化单元,得到所述至少一个平均池化单元。3.根据权利要求1所述的方法,其特征在于,所述利用所述深度可分离卷积算子和所述除法算子对所述至少一个平均池化单元进行平均池化处理,得到所述特征图对应的平均池化结果,包括:利用所述深度可分离卷积算子,对所述至少一个平均池化单元中每个平均池化单元内的元素进行求和,得到至少一个求和结果;利用所述除法算子,对所述至少一个求和结果中每个求和结果分别进行均值处理,得到所述特征图的平均池化结果。4.根据权利要求3所述的方法,其特征在于,所述利用所述深度可分离卷积算子,对所述至少一个平均池化单元中每个平均池化单元内的元素进行求和,得到至少一个求和结果,包括:将所述至少一个平均池化单元中,每个平均池化单元与所述深度可分离卷积算子进行卷积,得到至少一个卷积结果;将所述至少一个卷积结果中,每个卷积结果确定为一个求和结果,得到所述至少一个求和结果。5.根据权利要求1

4任一项所述的方法,其特征在于,所述深度可分离卷积算子的卷积核参数为1。6.根据...

【专利技术属性】
技术研发人员:杨金霄
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1