An image classification method and device, as well as an image processing system, are disclosed. Including the image classification method: receiving an input image; by using a n encoding unit cascaded image encoding to generate an output image to the input, n is an integer of 1 or more, for 1 < I < n, the I encoding unit input for the I encoding the input image and M
【技术实现步骤摘要】
图像分类和转换方法、装置以及图像处理系统
本公开涉及图像处理领域,具体涉及一种图像分类方法、图像分类装置、图像转换方法以及包括图像分类装置和图像还原装置的图像处理系统。
技术介绍
基于现有的图像分类方法,可以对输入图像进行分析并输出一个对应的标签,该标签代表了输入图像的图像类别。然而,根据现有的图像分类方法不能获得输入图像对应于其类别的像素信息。
技术实现思路
针对以上问题,本公开提供一种新的用于图像分类的方法、装置及其配置方法。根据本公开的一方面,提出了一种图像分类方法,包括:接收输入图像;利用级联的n级编码单元对所述输入图像进行图像编码以产生输出图像,n为大于等于1的整数,对于1≤i<n,第i级编码单元的输入为第i级编码输入图像并包括mi-1个图像成分,第i级编码单元的输出为第i级编码输出图像并包括mi个图像成分,以及第i级编码单元的输出是第i+1级编码单元的输入,其中m是大于1的整数;输出所述输出图像,所述输出图像包括mn个输出子图像,所述mn个输出子图像的每一个对应于一种图像类别;获取所述输出图像中mn个输出子图像的每一个的像素值,并根据像素值确定所述mn个输 ...
【技术保护点】
一种图像分类方法,包括接收输入图像;利用级联的n级编码单元对所述输入图像进行图像编码以产生输出图像,n为大于等于1的整数,对于1≤i<n,第i级编码单元的输入为第i级编码输入图像并包括m
【技术特征摘要】
1.一种图像分类方法,包括接收输入图像;利用级联的n级编码单元对所述输入图像进行图像编码以产生输出图像,n为大于等于1的整数,对于1≤i<n,第i级编码单元的输入为第i级编码输入图像并包括mi-1个图像成分,第i级编码单元的输出为第i级编码输出图像并包括mi个图像成分,以及第i级编码单元的输出是第i+1级编码单元的输入,其中m是大于1的整数;输出所述输出图像,所述输出图像包括mn个输出子图像,所述mn个输出子图像分别对应于第n级编码单元的mn个输出图像成分,并且所述mn个输出子图像的每一个对应于一种图像类别;获取所述输出图像中mn个输出子图像的每一个的像素值,并根据像素值确定所述mn个输出子图像中的至少一个是所述输入图像的类别子图像,以及确定所述输入图像的类别为对应于所述类别子图像的图像类别。2.如权利要求1所述的图像分类方法,其中根据所述mn个输出子图像中每一个的像素值,确定输入图像的类别包括:比较所述mn个输出子图像中每一个的像素值与第一阈值,将像素值大于第一阈值的输出子图像确定为类别子图像,并输出对应于所述类别子图像的类别标签,其中所述类别子图像包括输入图像中对应于所述类别标签的像素信息。3.如权利要求1所述的图像分类方法,其中所述输入图像、所述mn个输出子图像的每一个包括R、G、B三个通道。4.如权利要求1-3所述的图像分类方法,其中,利用第i级编码单元进行图像编码包括:接收第i级编码输入图像;对于所述第i级编码输入图像中的每个图像成分,将该图像成分拆分为m个编码输入成分,其中所述m个编码输入成分中的每一个的尺寸是第i级编码输入图像中的每个图像成分的尺寸的1/m倍,对所述m个编码输入成分进行图像变换,生成对应于该图像成分的m个编码输出成分,其中所述m个编码输出成分中的每一个的尺寸与所述m个编码输入成分中的每一个的尺寸相同;输出对应于第i级编码输入的mi-1个图像成分的mi个编码输出成分作为第i级编码输出图像。5.如权利要求4所述的图像分类方法,其中m=4,所述第i级编码输入图像中的每个图像成分被拆分为第一编码输入成分、第二编码输入成分、第三编码输入成分和第四编码输入成分,利用第i级编码单元对所述第一编码输入成分、所述第二编码输入成分、所述第三编码输入成分和所述第四编码输入成分进行图像变换包括:接收所述第一编码输入成分、所述第二编码输入成分、所述第三编码输入成分和所述第四编码输入成分;基于所述第一编码输入成分和所述第二编码输入成分生成预测图像并获取所述第三编码输入成分和所述第四编码输入成分和所述预测图像的差别图像;基于所述差别图像、所述第一编码输入成分和所述第二编码输入成分生成关于所述第一编码输入成分和所述第二编码输入成分的更新图像;执行基于所述更新图像的小波变换,并基于小波变换的结果生成第一编码输出成分和第二编码输出成分;执行基于所述差别图像的小波变换,并基于小波变换的结果生成第三编码输出和第四编码输出。6.如权利要求5所述的图像分类方法,其中,基于所述第一编码输入成分和所述第二编码输入成分生成预测图像并获取所述第三编码输入成分和所述第四编码输入成分和所述预测图像的差别图像包括:利用将所述第一编码输入成分和所述第二编码输入成分作为输入的第一预测卷积网络生成第一预测特征和第二预测特征;对所述第三编码输入成分和所述第一预测特征执行去叠加操作以获得第一差别特征;对所述第四编码输入成分和所述第二预测特征执行去叠加操作以获得第二差别特征;其中,基于所述差别图像、所述第一编码输入成分和所述第二编码输入成分生成更新图像包括:利用将所述第一差别特征和所述第二差别特征作为输入的第一更新卷积网络生成第一更新特征和第二更新特征;对所述第一编码输入成分与所述第一更新特征执行叠加操作以获得第一叠加特征;对所述第二编码输入成分与所述第二更新特征执行叠加操作以获得第二叠加特征。7.如权利要求6所述的图像分类方法,其中执行所述基于所述更新图像的小波变换,并基于小波变换的结果生成第一编码输出成分和第二编码输出成分包括:利用将所述第一叠加特征作为输入的第二预测卷积网络生成第三预测特征;对所述第二叠加特征与所述第三预测特征执行去叠加操作以获得所述第二编码输出成分;利用将所述第二编码输出成分作为输入的第二更新卷积网络生成第三更新特征;对所述第一叠加特征与所述第三更新特征执行叠加操作以获得所述第一编码输出成分。8.如权利要求6所述的图像分类方法,其中执行所述基于所述差别图像的小波变换,并基于小波变换的结果生成第三编码输出成分和第四编码输出成分包括:利用将所述第一差别特征作为输入的第三预测卷积网络生成第四预测特征;对所述第二差别特征与所述第四预测特征执行去叠加操作以获得所述第四编码输出成分;利用将所述第四编码输出成分作为输入的第三更新卷积网络生成第四更新特征;对所述第一差别特征与所述第四更新特征执行叠加操作以获得所述第三编码输出成分。9.一种图像分类装置,包括:输入端,配置成接收输入图像;级联的n级编码单元,配置成对所述输入图像进行图像编码以产生输出图像,n为大于等于1的整数,对于1≤i<n,第i级编码单元的输入为第i级编码输入图像并包括mi-1个图像成分,第i级编码单元的输出为第i级编码输出图像并包括mi个图像成分,以及第i级编码单元的输出是第i+1级编码单元的输入,其中m是大于1的整数;输出端,配置成输出所述输出图像,所述输出图像包括mn个输出子图像,所述mn个输出子图像分别对应于第n级编码单元的mn个输出图像成分,并且所述mn个输出子图像的每一个对应于一种图像类别;分类单元,配置成获取所述输出图像中mn个输出子图像的每一个的像素值,并根据像素值确定所述mn个输出子图像中的至少一个是所述输入图像的类别子图像,并确定所述输入图像的类别为对应于所述类别子图像的图像类别。10.如权利要求9所述的图像分类装置,其中分类单元进一步配置成:比较所述mn个输出子图像中每一个的像素值与第一阈值,将像素值大于第一阈值的输出子图像确定为类别子图像,并输出对应于所述类别子图像的类别标签,其中所述类别子图像包括输入图像中对应于所述类别标签的像素信息。11.如权利要求9所述的图像分类装置,其中所述输入图像、所述mn个输出子图像中的每一个包括R、G、B三个通道。12.如权利要求9-11所述的图像分类装置,其中第i级编码单元包括:输入端,配置成接收第i级编码输入图像;拆分单元,配置成对于所述第i级编码输入图像中的每个图像成分,将该图像成分拆分为m个编码输入成分,其中所述m个编码输入成分中的每一个的尺寸是第i级编码输入图像中的每个图像成分的尺寸的1/m倍;变换单元,配置成对于所述第i级编码输入图像中的每个图像成分,对从该图像成分拆分得到的所述m个编码输入成分进行图像变换,生成对应于该图像成分的m个编码输出成分,其中所述m个编码输出成分中的每一个的尺寸与所述m个编码输入成分中的每一个的尺寸相同;编码输出端,配置成输出对应于第i级编码输入的mi-1个图像成分的mi个编码输出成分作为第i级编码输出图像。13.如权利要求12所述的图像分类装置,其中,m=4,所述第i级编码输入图像中的每个图像成分被拆分为第一编码输入成分、第二编码输入成分、第三编码输入成分和第四编码输入成分,第i级编码单元的变换单元进一步包括:第一预测单元,配置成基于所述第一编码输入成分和所述第二编码输入成分生成预测图像并获取所述第三编码输入成分和所述第四编码输入成分和所述预测图像的差别图像;第一更新单元,配置成基于所述差别图像、所述第一编码输入成分和所述第二编码输入成分生成关于所...
【专利技术属性】
技术研发人员:那彦波,刘瀚文,
申请(专利权)人:京东方科技集团股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。