当前位置: 首页 > 专利查询>索尼公司专利>正文

画面编码和解码装置及其方法以及记录介质及其记录方法制造方法及图纸

技术编号:3617828 阅读:168 留言:0更新日期:2012-04-11 18:40
一种用于获得视频目标(VO)的定标装置和方法,该视频目标的位置和/或尺寸随时间而变化。在绝对坐标系中一个上层画面的位置和下层画面的位置被如此确定,以使得在放大的画面中以及上层画面中的相应象素被安排在绝对坐标系中的相同位置处。(*该技术在2017年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种画面编码和解码技术、画面处理技术、记录技术以及记录介质;尤其涉及一种这样的技术和记录介质,即,将运动画面数据记录到诸如磁光盘或者磁带介质上,再现所记录的数据以在显示系统上显示,或者把运动的画面数据经过传输通道从发射机传输至接收机,并且由接收机接收和显示所传输的数据,或者为了记录而编辑所接收的数据(如同在电视会议系统、视频电话系统、广播设备、以及多媒介数据库检索系统中那样)。在向一个远程的地方传输运动画面数据的系统中,如在电视会议系统或者视频电话系统中,通过使用或者利用线性相关性和帧间相关性,画面数据可以被编码(压缩)。用于运动画面的高效编码系统由运动画面专家小组(MPEG)建议。在ISO-1EC/JTC 1/SC2/WG11讨论之后,这样的系统作为一个标准的草案被建议,它是由运动补偿预测编码与离散余弦转变(DCT)结合的混合系统。在MPEG中,若干框架和级别被定义以便处理各种类型的应用和功能。最基本的是主要框架主要级别(运动画面ML(主要级别上的主要框架)(Main Profile@at main level))。在MPEG系统中,附图说明图1说明了MP@ML编码单元。在这样的编码单元中,将要编码的画面数据提供给帧存储器31,以瞬时地存储在其中。以1616个象素宏-块为基础,运动矢量检测器32读出存储在帧存储器31中的画面数据,以便检测它的运动矢量。运动矢量检测器32处理每一种帧比如I-画面,P-画面,以及B-画面的画面数据。每个依次进入的帧的画面被以预定方式处理为I-、P-或者B-画面之一,诸如I,B,P,B,P,…,B,P的序列。即,运动矢量检测器32参考存储在帧存储器31中的一系列画面中预定参考帧,并且检测宏块的运动矢量,即,该帧的16象素乘16行的一个小块通过在宏-块和参考帧之间的模式匹配(块匹配)而被编码,以检测宏-块的运动矢量。在MPEG中,有四种画面预测方式,即,内编码(帧内编码),前向预测编码,后向预测编码,以及双向预测编码。I-画面是帧内编码的画面,P-画面是帧内编码的或者前向预测编码或者后向预测编码画面,而且B-画面是帧内编码的,前向预测编码的,或者双向预测编码的画面。回到图1,运动矢量检测器32在P-画面上进行前向预测,以检测它的运动矢量。运动矢量检测器32把通过前向预测所产生的预测误差与,例如,被编码的宏-块的变化(P-画面的宏-块)进行比较。如果宏-块的变化比预测误差更小,帧内编码方式被设置为预测方式,并且输出至可变长度编码(VLC)单元36和运动补偿器42。另一方面,如果由前向预测编码产生的预测误差更小,运动矢量检测器32设置前向预测编码方式作为预测方式,并且与检测的运动矢量一同输出设定的方式到VLC单元36和运动补偿器42。另外,对于B-画面,运动矢量检测器32完成前向预测,后向的预测,以及双向预测,以检测各自的运动矢量。运动矢量检测器32检测前向预测,后向的预测,和双向预测的最小的预测误差(在这里被认作为最小预测误差),并且比较最小预测误差与,例如,被编码的宏-块的变化(B-画面的宏-块)。如果,这样比较产生的结果是,宏-块的变化比最小预测误差更小,则运动矢量检测器32设置帧内编码方式作为预测方式,并且输出设定的方式到VLC单元36和运动补偿器42。如果,另一方面,最小预测误差更小,运动矢量检测器32设置已经获得了最小预测误差的预测方式,并且与运动矢量一同输出这样设定的预测方式到VLC单元36和运动补偿器42。当从运动矢量检测器32接收预测方式和运动矢量时,依据预测方式和运动矢量,运动补偿器42可以读出存储在帧存储器41中的编码的和已经局部解码的的画面数据,并且可以提供读取的数据作为预测画面到运算单元33和40。运算单元33也接收与由运动矢量检测器32从帧存储器31读出的画面数据相同的宏-块,并且计算宏-块和从运动补偿器42来的预测画面之间的差别。这样的差别值提供到一个离散余弦变换(DCT)单元34。如果从运动矢量检测器32仅仅接收预测方式,即,如果预测方式是帧内编码方式,运动补偿器42不会输出预测画面。在这样的情形中,运算单元33不会完成上述-画面处理任务,但是可以直接输出从帧存储器31读出的宏-块到DCT单元34。而且,在这样的情形中,运算单元40可以以一种类似的方式完成任务。DCT单元34在运算单元33的输出信号上完成DCT处理,以获得向量化器35提供的DCT系数。依据作为缓冲器反馈而接收的在缓冲器37中的数据存储数量(被存储在缓冲器37中的数据量),量化器35设置量化步长(量化规模),并且利用量化步长量化从DCT单元34来的DCT系数。与设定的量化步长一同提供量化的DCT系数(在这里有时被认作为量化系数)到VLC单元36。依据从量化器35所提供的量化步长,VLC单元36把从量化器35所提供的量化系数转化成为一个可变长度码,比如哈夫曼(Huffman)编码。所转化的量化系数输出至缓冲器37。VLC单元36也可对从量化器35来的量化步长、从运动矢量检测器32来的预测方式以及从运动矢量检测器32来的运动矢量进行可变长度地编码,并且输出所编码的数据至缓冲器37。应该注意,预测方式是这样的方式,它说明,帧内编码,前向预测编码,后向预测编码,或者双向预测编码中的哪一种被设置了。缓冲器37瞬时地存储从VLC单元36来的数据,并且整平数据量,以使所整平的数据能够从其中输出,并且向传输通道提供或者记录在记录介质上等等。缓冲器37也可以向量化器35提供所存储的数据量,与此相应它又设置量化步长。如此,在缓冲器37的将近溢出的情况下,量化器35增加量化步长以减少量化系数的数据量规模。相反地,在缓冲器37的将近下溢的情况下,量化器35减少量化步长以增加量化系数的数据量规模。如同应理解的,这个过程可以阻止缓冲器37的溢出和下溢。不仅向VLC单元36,而且向去量化器38提供由量化器35输出的量化系数和量化步长,去量化器38依据量化步长对量化系数进行去量化,以将它转化成DCT系数。这样的DCT系数提供到IDCT(逆DCT)单元39,它在DCT系数上完成逆DCT。向运算单元40提供所获得的逆DCT系数。运算单元40接收从IDCT单元39来的反面DCT系数以及来自运动补偿器42的数据(它们与送到运算单元33的预测画面相同)。运算单元40将来自IDCT单元39的信号(预测冗余)加到从运动补偿器42来的预测的画面上,以局部地解码原来的画面。然而,如果预测方式表明是帧内编码,IDCT单元39的输出可以直接反馈到帧存储器41。由运算单元40获得的解码的画面(局部地被解码的画面)被送到并且被存储在帧存储器41中,稍后用作为帧内-编码画面、前向预测编码的画面、后向预测编码画面、或者双向预测编码画面的参考画面。从运算单元40所获得的解码的画面与从接收机或者解码单元(在图1中未显示)获得画面相同。图2说明MPEG系统中MP@ML解码器,其用以解码诸如由图1的编码器输出的编码数据。在这样的解码器中,经由传输通道所传输的编码数据可以由接收机(未显示)接收,或者记录在记录介质上的编码数据可以被一种再现的装置(未显示)再现,并且向缓冲器101提供,并且存储在其中。IVLC单元(逆VL本文档来自技高网...

【技术保护点】
一种画面编码装置,利用分辨率与第一画面不同的第二画面来编码第一画面,所述画面编码装置包括: 放大/压缩装置,基于第一和第二画面之间的分辨率差别,用以放大或者压缩所述第二画面; 第一画面编码装置,用所述放大/压缩装置的输出作为参考画面来预测编码所述第一幅画面; 第二画面编码装置,用于编码所述第二幅画面; 位置设置装置,用以设置在预定绝对坐标系中的第一幅画面与第二画面的位置,并且分别输出在第一或者第二画面的位置上的第一或者第二位置信息;以及 复用装置,用于复用所述第一画面编码装置,所述第二画面编码装置,以及所述位置设置装置的输出; 其中,所述第一画面编码装置基于所述第一个位置信息识别第一幅画面的位置,并且按照一种放大比或一种压缩比转化所述第二个位置信息,用这些比率,放大/压缩装置放大或者压缩所述第二幅画面,以获得所述参考画面的位置,以完成预测编码。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:铃木辉彦矢崎阳一
申请(专利权)人:索尼公司
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1