图像处理的方法、系统及计算机可读存储介质技术方案

技术编号:28224546 阅读:24 留言:0更新日期:2021-04-28 09:55
本发明专利技术公开了一种图像处理的方法、系统、计算机可读存储介质及计算机程序产品。该方法包括:获取待处理的多张图像;将多张图像进行拼接,得到拼接之后的拼图;将拼图输入到预先训练好的深度学习模型中,得到输出,其中深度学习模型中的卷积层的补齐模式为有效,并且深度学习模型中的池化核大小不大于池化步长;根据所述输出得到与多张图像一一对应的图像处理结果。可见,本申请中将多张图像拼接成拼图后再利用深度学习模型进行处理,由于针对拼图处理时的前向推理的时间更短,因此能够极大地缩短图像处理时间,提升处理效率。并且,使用本申请中的深度学习模型对拼图进行处理所得到的结果与针对多张图像进行批处理所得到的结果是一致的。果是一致的。果是一致的。

【技术实现步骤摘要】
图像处理的方法、系统及计算机可读存储介质


[0001]本专利技术实施例涉及图像处理领域,并且更具体地,涉及一种图像处理的方法、系统、计算机可读存储介质及计算机程序产品。

技术介绍

[0002]在各种应用场景中,有时要对大量的图像进行各种各样的批处理,在采用神经网络进行批处理的过程中,会将图像逐一地输入到神经网络,得到对应的输出。由此,针对大量的图像,需要神经网络对每一图像进行处理,这样的批处理方式造成了处理耗时过长,效率太低。

技术实现思路

[0003]本专利技术实施例提供了一种图像处理的方法、系统、计算机可读存储介质及计算机程序产品。
[0004]在第一方面,提供了一种图像处理的方法,包括:
[0005]获取待处理的多张图像;
[0006]将所述多张图像进行拼接,得到拼接之后的拼图;
[0007]将所述拼图输入到预先训练好的深度学习模型中,得到输出,其中所述深度学习模型中的卷积层的补齐模式为有效,并且所述深度学习模型中的池化核大小不大于池化步长;
[0008]根据所述输出得到与所述多张图像一一对应的图像处理结果。
[0009]在一个实施例中,所述深度学习模型为质量判断模型,所述图像处理结果包括图像质量得分。
[0010]在一个实施例中,所述多张图像为同一帧图像中的多个人脸图像或多个人体图像。
[0011]在一个实施例中,所述深度学习模型为目标跟踪模型,所述图像处理结果包括被跟踪的目标的边界框坐标。
[0012]在一个实施例中,所述多张图像中每张图像的宽为所述深度学习模型的总体步长的整数倍,且所述多张图像中每张图像的高为所述深度学习模型的总体步长的整数倍。
[0013]在一个实施例中,所述多张图像中每张图像具有相同的宽和高。
[0014]在一个实施例中,所述多张图像的数量为N,每张图像的宽为W,每张图像的高为H,并且所述拼图的宽为W
×
N,所述拼图的高为H。
[0015]在一个实施例中,所述多张图像的数量为N,每张图像的宽为W,每张图像的高为H,并且所述拼图的宽为W,所述拼图的高为H
×
N。
[0016]第二方面,提供了一种图像处理的系统,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序以实现第一方面所述方法的步骤。
[0017]第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程
序被处理器执行时实现第一方面所述方法的步骤。
[0018]第四方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现第一方面所述方法的步骤。
[0019]由此可见,本申请中将多张图像拼接成拼图后再利用深度学习模型进行处理,由于针对拼图处理时的前向推理的时间更短,因此能够极大地缩短图像处理时间,提升处理效率。并且,使用本申请中的深度学习模型对拼图进行处理所得到的结果与针对多张图像进行批处理所得到的结果是一致的。
附图说明
[0020]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0021]图1是本专利技术实施例提供的一种图像处理的方法的示意性流程图;
[0022]图2是本专利技术实施例的多张图像的一个示意图;
[0023]图3是本专利技术实施例的将图2中的多张图像拼接后的拼图的示意图;
[0024]图4是本专利技术实施例的批处理方法的网络拓扑的一个示意图;
[0025]图5是本专利技术实施例中拼图处理方法的网络拓扑的一个示意图;
[0026]图6是本专利技术实施例中拼图处理的层a=13的特征图尺寸的示意图;
[0027]图7是本专利技术实施例的图像处理的系统的一个示意框图。
具体实施方式
[0028]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0029]在各种应用场景中,有时要对大量的图像进行各种各样的批处理,在采用神经网络进行批处理的过程中,会将图像逐一地输入到神经网络,得到对应的输出。由此,针对大量的图像,需要神经网络对每一图像进行处理,这样的批处理方式造成了处理耗时过长,效率太低。基于此,本申请提供了一种图像处理的方法,能够将多张图像处理成拼图,再对拼图进行处理,这样能够极大地减小处理量,缩短处理时长。
[0030]如图1所示,是本申请实施例的图像处理的方法的一个示意性流程图。
[0031]图1所示的方法包括:
[0032]S10,获取待处理的多张图像;
[0033]S20,将所述多张图像进行拼接,得到拼接之后的拼图;
[0034]S30,将所述拼图输入到预先训练好的深度学习模型中,得到输出,其中所述深度学习模型中的卷积层的补齐模式为有效,并且所述深度学习模型中的池化核大小不大于池化步长;
[0035]S40,根据所述输出得到与所述多张图像一一对应的图像处理结果。
[0036]可理解的是,本申请中对S10中的多张图像的来源不做限定,作为一例,多张图像可以是在同一视频中的多帧图像;作为另一例,多张图像可以是同一帧图像中所截取出的不同区域。
[0037]可理解的是,本申请中对S10中的多张图像中所包含的对象不做限定,例如,每张图像可以包括人体或人脸或车牌或其他目标等。
[0038]在一个实施例中,多张图像可以是同一帧图像中的多个人脸图像或多个人体图像。在该实施例中,S10可以包括:获取一帧图像,通过人脸检测或人体检测得到所述一帧图像中的多个边界框。可选地,多个边界框可以具有相同的宽和高。
[0039]本申请,多张图像可以具有相同的空间尺寸,即具有相同的宽和高。例如,多张图像中每张图像的宽都为W,高都为H。
[0040]一般地,为了对多张图像进行批处理,可以表示为一个四维张量,如其形状为[n,h,w,c]或[n,w,h,c],其中n为批的大小,即多张图像的数量。h,w,c分别为图像高度、宽度以及通道数。作为一个示例,S10中的多张图像可以如图2所示,如图2中包括3张图像,且每张的宽相等,每张的高也相等,表示为四维张量为[3,H,W,C]。
[0041]示例性地,S20中,可以通过将多张图像沿着宽度方向依次拼接形成拼图,这样,拼图的宽等于多张图像的宽之和,拼图的高等于多张图像中高的最大值。或者,可以通过将多张图像沿着高度方向依次拼接形成拼图,这样,拼图的高等于多张图像的高之和,拼图的宽等于多张图像中宽的最大值。
[0042]假设每张图像的宽都是本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像处理的方法,其特征在于,包括:获取待处理的多张图像;将所述多张图像进行拼接,得到拼接之后的拼图;将所述拼图输入到预先训练好的深度学习模型中,得到输出,其中所述深度学习模型中的卷积层的补齐模式为有效,并且所述深度学习模型中的池化核大小不大于池化步长;根据所述输出得到与所述多张图像一一对应的图像处理结果。2.根据权利要求1所述的方法,其特征在于,所述深度学习模型为质量判断模型,所述图像处理结果包括图像质量得分。3.根据权利要求2所述的方法,其特征在于,所述多张图像为同一帧图像中的多个人脸图像或多个人体图像。4.根据权利要求1所述的方法,其特征在于,所述深度学习模型为目标跟踪模型,所述图像处理结果包括被跟踪的目标的边界框坐标。5.根据权利要求1所述的方法,其特征在于,所述多张图像中每张图像的宽为所述深度学习模型的总体步长的整数倍,且所述多张图像中每张图像的高为所...

【专利技术属性】
技术研发人员:罗伯特
申请(专利权)人:北京澎思科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1