当前位置: 首页 > 专利查询>索尼公司专利>正文

图像处理装置和方法制造方法及图纸

技术编号:20657460 阅读:120 留言:0更新日期:2019-03-23 08:50
本公开涉及一种图像处理装置和方法,能够抑制编码效率的恶化。一种图像处理装置包括:接收单元,其接收编码了具有多个主层的图像的编码数据和利用子层来控制是否执行层间预测的层间预测控制信息,其中层间预测是多个主层之间的预测;以及解码单元,其通过仅对由接收单元接收到的层间预测控制信息所指定的子层执行层间预测来对由接收单元接收到的编码数据的每个主层进行解码。本公开可应用到例如图像处理装置。

Image Processing Device and Method

The present disclosure relates to an image processing device and method capable of suppressing degradation of coding efficiency. An image processing apparatus includes: a receiving unit that receives and encodes coded data of an image with multiple main layers and uses a sublayer to control whether or not interlayer prediction is performed, in which interlayer prediction is a prediction between multiple main layers; and a decoding unit that performs only the sublayer specified by the interlayer prediction control information received by the receiving unit. Interlayer prediction is used to decode each main layer of coded data received by the receiving unit. The present disclosure may be applied to, for example, image processing devices.

【技术实现步骤摘要】
图像处理装置和方法本申请是申请号为201380034595.6、申请日为2013年9月19日、名称为“图像处理装置和方法”的专利技术专利申请的分案申请。更具体说,本分案申请是基于申请号为201610552082.X,申请日为2013年9月19日,专利技术名称为“图像处理装置和方法”的分案申请的再次分案申请。
本专利技术涉及图像处理装置和方法,具体而言涉及可抑制编码效率的恶化的图像处理装置和方法。
技术介绍
近年来,如下的一种装置已变得流行:其以数字方式处理图像信息,并且为了高效地传送和累积信息,其通过采用一种编码方法来对图像进行压缩和编码,该编码方法利用图像信息所特有的冗余性通过运动补偿和诸如离散余弦变换之类的正交变换来对图像进行压缩。此编码方法包括例如MPEG(MovingPictureExpertsGroup,运动图片专家组)。特别地,MPEG2(ISO/IEC13818-2)被定义为通用图像编码方法,并且是涵盖了隔行扫描图像和顺序扫描图像两者而且也涵盖了标准分辨率图像和高清晰度图像两者的标准。例如,当前MPEG2被广泛用在用于专业人员和消费者的应用中。通过使用MPEG2压缩方法,在具有720×480像素的标准分辨率的隔行扫描图像的情况下,分配4到8Mbps的码量(比特率)。通过使用MPEG2压缩方法,在具有1920×1088像素的高分辨率的隔行扫描图像的情况下,分配18到22Mbps的码量(比特率)。这使得高压缩率和优良的图像质量成为可能。MPEG2主要打算用于适合于广播的高清晰度图像编码,但并不涉及比MPEG1更低的码量(比特率),即不涉及具有更高压缩率的编码方法。随着便携式终端的普及,有可能更需要上述编码方法,并且因此,MPEG4编码方法已被标准化。关于图像编码方法,于1998年12月作为国际标准批准了名为ISO/IEC14496-2的规范。另外,近年来,为了对用于电话会议的图像进行编码,设定了称为H.26L(ITU-T(国际电信联盟电信标准化部门)Q6/16VCEG(VideoCodingExpertGroup,视频编码专家组))的标准。已经知道,H.26L实现了更高的编码效率,虽然H.26在编码和解码中要求比诸如MPEG2和MPEG4之类的传统编码方法更多的计算。另外,作为MPEG4的活动之一,基于此H.26L,实现更高编码效率的标准化正作为增强压缩视频编码联合模型被执行,其中引入了H.26L中不支持的功能。至于标准化的日程,于2003年3月以H.264和MPEG-4第10部分(高级视频编码,以下称为AVC)的名称设定了国际标准。此外,作为H.264/AVC的扩展,在2005年2月完成了包括MPEG-2中定义的量化矩阵或8×8DCT和诸如RGB、4:2:2和4:4:4之类的工作所必需的编码工具在内FRExt(FidelityRangeExtension,保真范围扩展)的标准化。这样,能够基于H.264/AVC来表达甚至胶片中包括的胶片噪声的编码方法被实现并使用在包括蓝光盘(Blu-RayDisc,商标)在内的广泛应用中。然而,近年来,对于具有更高压缩率的编码的需求增大了:用与高画质图像的四倍相对应的约4000×2000像素来压缩图像;或者在具有有限传送容量的环境中——例如在因特网上——分发高画质图像。这引发了对ITU-T下的VCEG中的编码效率的提高的进一步考查。鉴于此,为了与AVC相比提高编码效率,作为ITU-T和ISO/IEC联合标准化团体的JCTVC(JointCollaborationTeam–VideoCoding,联合协作组–视频编码)已推进了被称为HEVC(HighEfficiencyVideoCoding,高效率视频编码)的编码方法的标准化。至于HEVC规范,于2012年2月发布了对应于初稿的委员会草案(例如,参见非专利文献1)。顺便说一下,诸如MPEG-2或AVC之类的传统图像编码方法具有通过将图像划分成多层来对图像编码的可伸缩性(scalability)功能。换言之,仅基本层(baselayer)的图像压缩信息被传送到诸如蜂窝电话之类的具有低处理能力的终端,使得具有低空间时间分辨率或低图像质量的运动图像被再现;另一方面,除了基本层的信息以外,增强层(enhancementlayer)的图像压缩信息也被传送到诸如TV或个人计算机之类的具有高处理能力的终端,使得具有高空间时间分辨率或者高图像质量的运动图像被再现。从而,可以从服务器发送取决于终端或网络的能力的图像压缩信息,而没有转码处理。顺便说一下,在可伸缩编码中,对于所有图片执行层之间的预测处理导致了计算量的增大。鉴于此,已建议在NAL单元(NAL_Unit)中对于每一图片(picture)指定层之间的预测处理的开/关(on/off)(例如,参见非专利文献2)。引文列表专利文献非专利文献非专利文献1:BenjaminBross,Woo-JinHan,Jens-RainerOhm,GaryJ.Sullivan,ThomasWiegand,"Highefficiencyvideocoding(HEVC)textspecificationdraft6",JCTVC-H1003ver21,ITU-TSG16WP3和ISO/IECJTC1/SC29/WG的视频编码联合协作组(JCT-VC)的第117次会议:日内瓦,瑞士,2011年11月21日-30日非专利文献2:JizhengXu,"AHG10:Selectiveinter-layerpredictionsignallingforHEVCscalableextension",JCTVC-J0239,ITU-TSG16WP3和ISO/IECJTC1/SC29/WG的视频编码联合协作组(JCT-VC)的第1110次会议:斯德哥尔摩,瑞典,2012年7月11日-20日
技术实现思路
本专利技术要解决的问题然而,在传统方法中,用于控制层之间的预测处理的开/关(on/off)的信息是对每个图片生成和传送的。因此,有这样的风险:即,由于该信息的传送,码量将会增大,从而使编码效率恶化。本专利技术是鉴于上述情况而作出的,并且要抑制编码效率的恶化。解决问题的方案本技术的一方面是一种图像处理装置,包括:接收单元,该接收单元接收编码了具有多个主层的图像的编码数据和利用子层来控制是否执行层间预测的层间预测控制信息,其中层间预测是多个主层之间的预测;以及解码单元,该解码单元通过仅对由接收单元接收到的层间预测控制信息所指定的子层执行层间预测来对由接收单元接收到的编码数据的每个主层进行解码。如果当前主层的当前图片属于如下子层,则解码单元可利用层间预测对当前图片的编码数据进行解码:该子层被层间预测控制信息指定为对其执行层间预测的子层。层间预测控制信息可指定允许层间预测的最高子层;并且解码单元可利用层间预测对属于从最低子层到层间预测控制信息指定的最高子层的子层的图片的编码数据进行解码。层间预测控制信息可对每个主层设定。层间预测控制信息可被设定为所有主层共通的参数。接收单元可接收控制是否执行层间像素预测的层间像素预测控制信息和控制是否执行层间语法预测的层间语法预测控制信息,其中层间像素预测是多个主层之间的像素预测,层间语法预本文档来自技高网
...

【技术保护点】
1.一种视频处理装置,包括视频输入处理单元、第一图像放大/缩小单元、第二图像放大/缩小单元、视频输出处理单元、帧存储器、存储器控制单元、编码/解码引擎、基本流缓冲器、音频编码器、音频解码器、复用器、解复用器以及流缓冲器,其中,视频输入处理单元获取视频信号输入并将该信号转换成图像数据;第一图像放大/缩小单元对图像数据执行格式转换或者放大/缩小图像;第二图像放大/缩小单元根据数据通过视频输出处理单元被输出到的目的地处的格式对图像数据执行图像放大/缩小处理;视频输出处理单元对图像数据执行格式转换或者将图像数据转换成模拟信号,并将数据作为再现视频信号输出;帧存储器存储被视频输入处理单元、第一图像放大/缩小单元、第二图像放大/缩小单元、视频输出处理单元和编码/解码引擎共享的图像数据;存储器控制单元在接收到来自编码/解码引擎的同步信号时控制在帧存储器中写入和从帧存储器读取的访问;编码/解码引擎对图像数据编码并且对作为通过对图像数据编码而获得的数据的视频流解码;基本流缓冲器缓冲由编码/解码引擎生成的视频和音频流,并将该流提供给复用器,并且缓冲从解复用器提供来的视频和音频流,并将该流提供给编码/解码引擎;音频编码器把所输入的音频信号转换成数字信号,按预定方法对该信号编码;音频解码器对从基本流缓冲器提供来的音频流解码,并将该流转换成模拟信号;复用器,对视频流和音频流进行复用;解复用器,按照与复用器进行的复用相对应的方法对其中复用了视频流和音频流的比特流进行解复用;流缓冲器,对比特流进行缓冲。...

【技术特征摘要】
2012.09.28 JP 2012-218307;2012.12.26 JP 2012-283591.一种视频处理装置,包括视频输入处理单元、第一图像放大/缩小单元、第二图像放大/缩小单元、视频输出处理单元、帧存储器、存储器控制单元、编码/解码引擎、基本流缓冲器、音频编码器、音频解码器、复用器、解复用器以及流缓冲器,其中,视频输入处理单元获取视频信号输入并将该信号转换成图像数据;第一图像放大/缩小单元对图像数据执行格式转换或者放大/缩小图像;第二图像放大/缩小单元根据数据通过视频输出处理单元被输出到的目的地处的格式对图像数据执行图像放大/缩小处理;视频输出处理单元对图像数据执行格式转换或者将图像数据转换成模拟信号,并将数据作为再现视频信...

【专利技术属性】
技术研发人员:佐藤数史
申请(专利权)人:索尼公司
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1