图像处理方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:25188194 阅读:41 留言:0更新日期:2020-08-07 21:15
本申请公开了一种图像处理方法、装置、电子设备及计算机可读存储介质,涉及图像处理技术领域。具体实现方案为:获取待处理图像;将所述待处理图像转化为三通道YUV图像;对所述三通道YUV图像中的Y通道图像、U通道图像和V通道图像进行卷积运算,分别生成R通道图像、G通道图像和B通道图像,得到三通道RGB图像;对所述三通道RGB图像进行预处理。根据本申请中方案,可以提升图像预处理速度。

【技术实现步骤摘要】
图像处理方法、装置、电子设备及计算机可读存储介质
本申请涉及图像处理
,尤其涉及一种图像处理方法、装置、电子设备及计算机可读存储介质。
技术介绍
在现有的计算机视觉技术中,图像预处理是必不可少的一步。目前常用的图像预处理方式为:针对待处理图像中的每一个像素点,依次进行数据格式整理、RGB转化、数据归一化等流程。但此方式会耗费较多的处理时间,造成处理速度慢。
技术实现思路
本申请实施例提供一种图像处理方法、装置、电子设备及计算机可读存储介质,以解决现有图像预处理方式的处理速度慢的问题。为了解决上述技术问题,本申请是这样实现的:第一方面,本申请实施例提供了一种图像处理方法,包括:获取待处理图像;将所述待处理图像转化为三通道YUV图像;对所述三通道YUV图像中的Y通道图像、U通道图像和V通道图像进行卷积运算,分别生成R通道图像、G通道图像和B通道图像,得到三通道RGB图像;对所述三通道RGB图像进行预处理。这样,在图像预处理过程中,可以借助卷积运算对转化得到的三通道YUV图像中的Y通道图像、U通道图像和V通道图像进行处理,以生成三通道RGB图像,并对该三通道RGB图像进行预处理,从而缩短将YUV图像转化为RGB图像的时间,从而提升图像预处理速度。可选的,所述将所述待处理图像转化为三通道YUV图像,包括:将所述待处理图像划分为第一Y通道图像和UV通道图像;对所述第一Y通道图像进行调整,得到维度为(N,1,W,H)的Y通道图像;对所述UV通道图像进行分离,得到维度为(N,1,W*0.5,H*0.5)的U通道图像和维度为(N,1,W*0.5,H*0.5)的V通道图像;分别对所述维度为(N,1,W*0.5,H*0.5)的U通道图像和所述维度为(N,1,W*0.5,H*0.5)的V通道图像进行2倍采样,得到维度为(N,1,W,H)的U通道图像和维度为(N,1,W,H)的V通道图像;将维度为(N,1,W,H)的Y通道图像、U通道图像和V通道图像进行合并,得到维度为(N,3,W,H)的YUV图像;其中,所述N表示所述待处理图像的个数,所述1表示所述Y通道图像、所述U通道图像或所述V通道图像为1个通道,所述3表示所述YUV图像为3个通道,所述W等于所述待处理图像的宽度,所述H等于所述待处理图像的高度。这样,借助上述分离、采样和合并的过程,可以高效地获得满足后续卷积运算需求的三通道YUV图像。可选的,所述对所述UV通道图像进行分离,得到维度为(N,1,W*0.5,H*0.5)的U通道图像和维度为(N,1,W*0.5,H*0.5)的V通道图像,包括:将所述UV通道图像调整为维度为(N,2,W*H*0.25)的UV通道图像;对所述维度为(N,2,W*H*0.25)的UV通道图像进行分离,得到维度为(N,1,W*H*0.25)的U通道图像和维度为(N,1,W*H*0.25)的V通道图像;将所述维度为(N,1,W*H*0.25)的U通道图像调整为所述维度为(N,1,W*0.5,H*0.5)的U通道图像,和将所述维度为(N,1,W*H*0.25)的V通道图像调整为所述维度为(N,1,W*0.5,H*0.5)的V通道图像。这样,可以准确实现UV通道图像的分离。可选的,所述分别对所述维度为(N,1,W*0.5,H*0.5)的U通道图像和所述维度为(N,1,W*0.5,H*0.5)的V通道图像进行2倍采样,得到维度为(N,1,W,H)的U通道图像和维度为(N,1,W,H)的V通道图像,包括:利用nearest插值函数,分别对所述维度为(N,1,W*0.5,H*0.5)的U通道图像和所述维度为(N,1,W*0.5,H*0.5)的V通道图像进行2倍的最邻近上采样,得到所述维度为(N,1,W,H)的U通道图像和所述维度为(N,1,W,H)的V通道图像。这样,利用nearest插值函数进行2倍的最邻近上采样,可以准确采样得到的所需的U通道图像和V通道图像。可选的,所述对所述三通道RGB图像进行预处理,包括:利用批归一化函数对所述三通道RGB图像进行预处理。这样,借助批归一化函数可以实现对三通道RGB图像的统一预处理,从而加速预处理过程。可选的,所述批归一化函数为:其中,所述output表示预处理后图像的像素值,所述input表示预处理前图像的像素值,所述scale表示缩放系数,所述bias表示偏置值,所述mean表示均值,所述variance表示方差,所述epsilon表示预设的除法数值稳定系数。可选的,所述得到三通道RGB图像之后,所述方法还包括:对所述三通道RGB图像的尺寸进行调整;所述对所述三通道RGB图像进行预处理,包括:对调整尺寸后的三通道RGB图像进行预处理。第二方面,本申请实施例还提供了一种图像处理装置,包括:获取模块,用于获取待处理图像;转化模块,用于将所述待处理图像转化为三通道YUV图像;运算模块,用于对所述三通道YUV图像中的Y通道图像、U通道图像和V通道图像进行卷积运算,分别生成R通道图像、G通道图像和B通道图像,得到三通道RGB图像;预处理模块,用于对所述三通道RGB图像进行预处理。可选的,所述转化模块包括:划分单元,用于将所述待处理图像划分为第一Y通道图像和UV通道图像;调整单元,用于对所述第一Y通道图像进行调整,得到维度为(N,1,W,H)的Y通道图像;分离单元,用于对所述UV通道图像进行分离,得到维度为(N,1,W*0.5,H*0.5)的U通道图像和维度为(N,1,W*0.5,H*0.5)的V通道图像;采样单元,用于分别对所述维度为(N,1,W*0.5,H*0.5)的U通道图像和所述维度为(N,1,W*0.5,H*0.5)的V通道图像进行2倍采样,得到维度为(N,1,W,H)的U通道图像和维度为(N,1,W,H)的V通道图像;合并单元,用于将维度为(N,1,W,H)的Y通道图像、U通道图像和V通道图像进行合并,得到维度为(N,3,W,H)的YUV图像;其中,所述N表示所述待处理图像的个数,所述1表示所述Y通道图像、所述U通道图像或所述V通道图像为1个通道,所述3表示所述YUV图像为3个通道,所述W等于所述待处理图像的宽度,所述H等于所述待处理图像的高度。可选的,所述分离单元包括:第一调整子单元,用于将所述UV通道图像调整为维度为(N,2,W*H*0.25)的UV通道图像;分离子单元,用于对所述维度为(N,2,W*H*0.25)的UV通道图像进行分离,得到维度为(N,1,W*H*0.25)的U通道图像和维度为(N,1,W*H*0.25)的V通道图像;第二调整子单元,用于将所述维度为(N,1,W*H*0.25)的U通道图像,调整为所述维度为(N,1,W*0.5本文档来自技高网...

【技术保护点】
1.一种图像处理方法,其特征在于,包括:/n获取待处理图像;/n将所述待处理图像转化为三通道YUV图像;/n对所述三通道YUV图像中的Y通道图像、U通道图像和V通道图像进行卷积运算,分别生成R通道图像、G通道图像和B通道图像,得到三通道RGB图像;/n对所述三通道RGB图像进行预处理。/n

【技术特征摘要】
1.一种图像处理方法,其特征在于,包括:
获取待处理图像;
将所述待处理图像转化为三通道YUV图像;
对所述三通道YUV图像中的Y通道图像、U通道图像和V通道图像进行卷积运算,分别生成R通道图像、G通道图像和B通道图像,得到三通道RGB图像;
对所述三通道RGB图像进行预处理。


2.根据权利要求1所述的方法,其特征在于,所述将所述待处理图像转化为三通道YUV图像,包括:
将所述待处理图像划分为第一Y通道图像和UV通道图像;
对所述第一Y通道图像进行调整,得到维度为(N,1,W,H)的Y通道图像;
对所述UV通道图像进行分离,得到维度为(N,1,W*0.5,H*0.5)的U通道图像和维度为(N,1,W*0.5,H*0.5)的V通道图像;
分别对所述维度为(N,1,W*0.5,H*0.5)的U通道图像和所述维度为(N,1,W*0.5,H*0.5)的V通道图像进行2倍采样,得到维度为(N,1,W,H)的U通道图像和维度为(N,1,W,H)的V通道图像;
将维度为(N,1,W,H)的Y通道图像、U通道图像和V通道图像进行合并,得到维度为(N,3,W,H)的YUV图像;
其中,所述N表示所述待处理图像的个数,所述1表示所述Y通道图像、所述U通道图像或所述V通道图像为1个通道,所述3表示所述YUV图像为3个通道,所述W等于所述待处理图像的宽度,所述H等于所述待处理图像的高度。


3.根据权利要求2所述的方法,其特征在于,所述对所述UV通道图像进行分离,得到维度为(N,1,W*0.5,H*0.5)的U通道图像和维度为(N,1,W*0.5,H*0.5)的V通道图像,包括:
将所述UV通道图像调整为维度为(N,2,W*H*0.25)的UV通道图像;
对所述维度为(N,2,W*H*0.25)的UV通道图像进行分离,得到维度为(N,1,W*H*0.25)的U通道图像和维度为(N,1,W*H*0.25)的V通道图像;
将所述维度为(N,1,W*H*0.25)的U通道图像调整为所述维度为(N,1,W*0.5,H*0.5)的U通道图像,和将所述维度为(N,1,W*H*0.25)的V通道图像调整为所述维度为(N,1,W*0.5,H*0.5)的V通道图像。


4.根据权利要求2所述的方法,其特征在于,所述分别对所述维度为(N,1,W*0.5,H*0.5)的U通道图像和所述维度为(N,1,W*0.5,H*0.5)的V通道图像进行2倍采样,得到维度为(N,1,W,H)的U通道图像和维度为(N,1,W,H)的V通道图像,包括:
利用nearest插值函数,分别对所述维度为(N,1,W*0.5,H*0.5)的U通道图像和所述维度为(N,1,W*0.5,H*0.5)的V通道图像进行2倍的最邻近上采样,得到所述维度为(N,1,W,H)的U通道图像和所述维度为(N,1,W,H)的V通道图像。


5.根据权利要求1所述的方法,其特征在于,所述对所述三通道RGB图像进行预处理,包括:
利用批归一化函数对所述三通道RGB图像进行预处理。


6.根据权利要求5所述的方法,其特征在于,所述批归一化函数为:



其中,所述output表示预处理后图像的像素值,所述input表示预处理前图像的像素值,所述scale表示缩放系数,所述bias表示偏置值,所述mean表示均值,所述variance表示方差,所述epsilon表示预设的除法数值稳定系数。


7.根据权利要求1所述的方法,其特征在于,所述得到三通道RGB图像之后...

【专利技术属性】
技术研发人员:王康康
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1