【技术实现步骤摘要】
【国外来华专利技术】图像处理方法、设备及计算机可读存储介质
本专利技术实施例涉及图像处理
,尤其涉及一种图像处理方法、图像处理设备及计算机可读存储介质。
技术介绍
由于图像信息中往往包含很多的冗余信息,因此,当利用数字方法传输或存储时需要对图像信息进行图像编码。图像编码也称图像压缩,是指在满足一定质量的条件下,以较少比特数表示图像或图像中所包含信息的技术。现有的图像编码一般通过图像编码器实现,由于不同的图像之间往往存在差异,故不同的图像特征之间也存在差异。在通过图像编码器进行图像编码时,需要编码人员人工对不同图像进行特征提取,并根据提取到的特征进行参数调节。但是,采用上述方法进行图像编码时,一方面在特征提取过程中无法直接提取到图像的本质特征,另一方面,上述方法往往对编码人员的专业素质要求较高,且特征提取以及参数确定均由人工实现,较为耗时耗力,进而导致图像编码效率较低。
技术实现思路
本专利技术实施例提供一种图像处理方法、图像处理设备及计算机可读存储介质,以解决现有技术中通过人工进行图像编码较为耗时耗力的 ...
【技术保护点】
1.一种图像处理方法,其特征在于,包括:/n获取待处理图像的频域信息,所述频域信息通过图像编码器进行时频转换处理获得;/n通过预设的第一神经网络模型对所述频域信息进行处理,获得所述待处理图像的第一编码参数;/n将所述第一编码参数发送至所述图像编码器,以使所述图像编码器根据所述第一编码参数对所述待处理图像进行编码。/n
【技术特征摘要】
【国外来华专利技术】1.一种图像处理方法,其特征在于,包括:
获取待处理图像的频域信息,所述频域信息通过图像编码器进行时频转换处理获得;
通过预设的第一神经网络模型对所述频域信息进行处理,获得所述待处理图像的第一编码参数;
将所述第一编码参数发送至所述图像编码器,以使所述图像编码器根据所述第一编码参数对所述待处理图像进行编码。
2.根据权利要求1所述的方法,其特征在于,所述第一神经网络模型包括依次连接的N个运算单元;其中,所述通过预设的第一神经网络模型对所述频域信息进行处理,获得所述待处理图像的第一编码参数,包括:
将所述频域信息输入至所述第一神经网络模型的第n个运算单元,通过所述第一神经网络模型的第N个运算单元输出所述第一编码参数;
其中,N≥n;n为大于等于2的正整数。
3.根据权利要求1所述的方法,其特征在于,所述第一神经网络模型包括如下至少一种:VGG-16模型,VGG-19模型,ResNet模型,GoogLeNet模型。
4.根据权利要求2所述的方法,其特征在于,n=2。
5.根据权利要求1至4任一项所述的方法,其特征在于,在所述通过预设的第一神经网络模型对所述频域信息进行处理之前,所述方法还包括:
通过预设的第一训练数据集对所述第一神经网络模型进行训练;其中,所述第一训练数据集包括若干已标注其第一编码参数的图像的频域信息。
6.根据权利要求5所述的方法,其特征在于,所述第一训练数据集通过以下步骤获得:
将若干已标注其第一编码参数的图像进行时频转换,获得其频域信息;
根据所述已标注其第一编码参数的图像的频域信息形成所述第一训练数据集。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述方法还包括:
若所述待处理图像为YUV格式,则确定所述待处理图像的U通道和V通道的维度与Y通道的维度;
若所述U通道和V通道的维度与所述Y通道的维度不一致,则对所述待处理图像执行预处理操作,以使得所述待处理图像的所述U通道和V通道的维度与所述Y通道的维度一致。
8.根据权利要求1至6任一项所述的方法,其特征在于,所述方法还包括:
若所述待处理图像为预设的格式,则对所述待处理图像执行预处理操作,以使得所述待处理图像的所述U通道和V通道的维度与所述Y通道的维度一致。
9.根据权利要求8所述的方法,其特征在于,当所述预设的格式为YUV422格式或者YUV420格式,则对所述待处理图像执行预处理操作,以使得所述待处理图像的所述U通道和V通道的维度与所述Y通道的维度一致。
10.根据权利要求7至9任一项所述的方法,其特征在于,所述对所述待处理图像执行预处理操作,以使得所述待处理图像的所述U通道和V通道的维度与所述Y通道的维度一致,包括:
对所述待处理图像的所述U通道和V通道进行上采样操作,使得所述待处理图像的Y、U和V三通道的维度相同。
11.根据权利要求10所述的方法,其特征在于,所述对所述待处理图像的所述U通道和V通道进行上采样操作,使得所述待处理图像的Y、U和V三通道的维度相同,包括:
对所述待处理图像的所述U通道和V通道进行双线性插值操作,使得所述待处理图像的Y、U和V三通道的维度相同。
12.根据权利要求7至9任一项所述的方法,其特征在于,所述对所述待处理图像执行预处理操作,以使得所述待处理图像的所述U通道和V通道的维度与所述Y通道的维度一致,包括:
对所述待处理图像的所述Y通道进行下采样操作,使得所述待处理图像的Y、U和V三通道的维度相同。
13.根据权利要求7至12任一项所述的方法,其特征在于,所述获取待处理图像的频域信息,包括:
将维度一致的所述待处理图像的Y、U和V通道分别进行DCT变换,生成Y、U和V通道的频域信息。
14.根据权利要求7至12任一项所述的方法,其特征在于,所述获取待处理图像的频域信息,包括:
将维度一致的所述待处理图像的Y、U和V通道分别进行DWT变换,生成Y、U和V通道的频域信息。
15.根据权利要求13或14所述的方法,其特征在于,在所述通过预设的第一神经网络模型对所述频域信息进行处理之前,所述方法还包括:
将所述待处理图像的Y、U和V通道的频域信息进行级联。
16.根据权利要求1至15任一项所述的方法,其特征在于,所述第一编码参数包括典型量化参数设计、量化表设计、特征变换精度设计、码率控制的比例设计中的至少一项。
17.根据权利要求1至15任一项所述的方法,其特征在于,所述将所述第一编码参数发送至所述图像编码器,以使所述图像编码器根据所述第一编码参数对所述待处理图像进行编码,包括:
将所述第一编码参数发送至所述图像编码器,以使所述图像编码器根据所述第一编码参数对所述待处理图像的频域信息进行量化处理和熵编码处理。
18.根据权利要求1至15任一项所述的方法,其特征在于,所述将所述第一编码参数发送至所述图像编码器,以使所述图像编码器根据所述第一编码参数对所述待处理图像进行编码,包括:
将所述第一编码参数发送至所述图像编码器,以使所述图像编码器根据所述第一编码参数对所述频域信息进行量化处理并生成所述待处理图像的量化信息。
19.根据权利要求18所述的方法,其特征在于,所述方法还包括:
获取所述待处理图像的量化信息;
通过预设的第二神经网络模型对所述量化信息进行处理,获得所述待处理图像的第二编码参数;
将所述第二编码参数发送至所述图像编码器,以使所述图像编码器根据所述第二编码参数对所述待处理图像进行编码。
20.根据权利要求19所述的方法,其特征在于,所述将所述第二编码参数发送至所述图像编码器,以使所述图像编码器根据所述第二编码参数对所述待处理图像进行编码,包括:
将所述第二编码参数发送至所述图像编码器,以使所述图像编码器根据所述第二编码参数对所述量化信息进行熵编码处理。
21.根据权利要求19所述的方法,其特征在于,所述第二神经网络包括依次连接的M个运算单元;其中,所述通过预设的第二神经网络模型对所述量化信息进行处理,获得所述待处理图像的第二编码参数,包括:
将所述量化信息输入至所述第二神经网络模型的第m个运算单元,通过所述第二神经网络模型的第M个运算单元输出所述第二编码参数;
其中,M≥m;m为大于等于2的正整数。
22.根据权利要求19所述的方法,其特征在于,所述第二神经网络模型包括如下至少一种:VGG-16模型,VGG-19模型,ResNet模型,GoogLeNet模型。
23.根据权利要求19所述的方法,其特征在于,所述第二编码参数包括典型量化参数设计、量化表设计、码率控制的比例设计中的至少一项。
24.根据权利要求1至17任一项所述的方法,其特征在于,所述方法还包括:
所述图像编码器根据所述第一编码参数对所述待处理图像进行编码,获得所述待处理图像的码流信息。
25.根据权利要求24所述的方法,其特征在于,还包括:
利用图像解码器对所述码流信息执行解码操作,获得重建的待处理图像。
26.一种图像处理设备,其特征在于,包括:存储器和处理器;
所述存储器用于存储程序代码;
所述处理器,调用所述程序代码,当程序代码被执行时,用于执行以下操作:
获取待处理图像的频域信息,所述频域信息通过图像编码器进行...
【专利技术属性】
技术研发人员:李恒杰,赵文军,
申请(专利权)人:深圳市大疆创新科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。