对具有象素的数字图像进行运动估算的方法和装置制造方法及图纸

技术编号:2950874 阅读:153 留言:0更新日期:2012-04-11 18:40
对具有象素的数字图像进行运动估算的方法和装置,其中,象素被分组到图象块。象素被分组到至少第一图象区域和第二图象区域。第一运动估算在第一检索区域被实现,以便确定一个第一运动矢量。此外,第二运动估算在第二检索区域被实现,以便确定一个第二运动矢量。第一检索区域和第二检索区域大小不同。(*该技术在2019年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及对具有象素的数字图像进行的运动估算。这样的方法不同于参考文献。在参考文献的运动估算方法中,将要进行运动估算的数字块中的象素被分组成为若干图象块。对于在图象中的每一个图象块,在大小可以预先确定的检索区域内进行尝试,以确定图象块中一个与检索区域同样大小的编码信息最相似的区域,该编码信息包括在进行运动估算的图象块中。在下文中,名词“编码信息”意味着与一个象素相关的亮度信息(亮度值)或颜色信息(色度值)。为此,在先前图象中,基于图象块在先前图象中的位置,对于大小可以预先确定的区域(检索区域)中的每一个位置,具有相应大小的包括与图象块中的象素数量相同的象素的区域被形成;并且,将要进行运动估算的图象块的编码信息和在先前图象中的不同区域的编码信息之间的绝对偏差和或偏差的平方和被形成。最佳匹配的区域,这也就是说和值最小的区域,被视作匹配图象块,并且在先前图象的“最佳”区域和该图象块之间图象块位置的移动被确定。这个移动被称为运动矢量。本专利技术针对上述问题,提供了一种可以减少为编码数字图象的运动估算的运动矢量所需总位数的方法和装置。具有独立权利要求的特征的方法和装置,解决了这个问题。在对具有象素的数字图像进行运动估算的方法中,象素被分组到图象块中。象素至少被分组到第一图象区域和第二图象区域。在第一检索区域,至少为在第一图象区域的第一图象块实行第一运动估算,以便确定第一个运动矢量,利用它,通过比较在先前图象中的第一图象块或后面的图象中的第一图象块,第一图象块的移动被描述。进一步,在第二检索区域,至少为在第二图象区域中的第二图象块实行第二运动估算,以便确定第二个运动矢量,利用它,通过比较在前面的原来图象中的第二图象块或通过比较在后面的后继图象中的第二图象块,第二图象块的移动被确定。第一检索区域和第二检索区域大小不同。对具有象素的数字图像进行运动估算的装置,具有一个处理器,它被如此设定以便执行下述步骤象素被分组到图象块,象素被分组以便至少形成一个第一图象区域和第二图象区域,在第一检索区域,至少为在第一图象区域中的第一图象块实行第一运动估算,以便确定第一个运动矢量,利用它,通过比较在先前图象中的第一图象块或后面的图象中的第一图象块,第一图象块的移动被描述;进一步,在第二检索区域,至少为在第二图象区域中的第二图象块实行第二运动估算,以便确定第二个运动矢量,利用它,通过比较在前面的原来图象中的第二图象块或通过比较在后面的后继图象中的第二图象块,第二图象块的移动被确定;第一检索区域和第二检索区域大小不同。本专利技术可以减少为压缩视频数据传输而要求的数据量,因为运动矢量的大小可自适应地符合质量的要求,所以即使在非常小的检索区域,也没有明显的图象质量的主观印象的下降,例如,在只要求低质量的区域中。检索区域中运动矢量的最大尺寸也因此相对小,这导致运动矢量编码的位数被减小。从本专利技术可以明显的看出不同大小的检索区域被用于该图象区域中的图象块的运动估算,本专利技术可以根据质量灵活的减少运动矢量编码所要求的数据量。从从属权利要求中可得出本专利技术的进一步改进。一个改进规定第一检索区域和/或第二检索区域的大小是预先确定的图象质量的函数,利用它,第一图象块和/或第二图象块被编码。以这种方式,一种限制检索区域的方法被确定,它根据要求的图象质量减少需求的数据量。在一个实施例中,一个十分简单的确定检索区域大小的标准是一个量化参数,通过它第一图象块和/或第二图象块被量化。进一步的改进规定一定数量的表格,存储不同长度的编码的代码,它们用于运动矢量的不同的长度编码,这样导致进一步减少视频数据的传输所要求的数据量。本专利技术的一个实施例将在下面详细介绍,并在下面的图中图示,其中附图说明图1a到1c显示了图象和先前图象的略图,其中,图示了本专利技术的基本原理;图2显示了具有两个计算机、一个摄像机和一个显示器的装置,通过它视频数据被编码、传送、解码和显示;图3显示了基于块的数字图象的编码设备的略图。图2显示了包括两台计算机202,208和一个摄像机201的装置,显示了图象的编码、视频数据的传输和图象的解码。摄像机201通过连线19连接到第一计算机202。摄像机201传送它拍摄的图象204到第一计算机202。第一计算机202拥有第一处理器203,它通过总线218连接到帧存储器205。在第一计算机202的第一处理器203执行一种图象编码方法。以这种方式,编码的视频数据206从第一计算机202通过通讯链路207,最好是电缆或是无线路径,被传送到第二计算机208。第二计算机208拥有第二处理器209,它通过总线210连接到帧存储器211。通过第二处理器209,图象解码方法被实行。第一计算机202和第二计算机208具有各自的显示器212或213,通过它们视频数据204被显示。输入单元,最好是键盘214或215和计算机鼠标216或217,被分别提供给第一计算机202和第二计算机208。通过连线219从摄像机201传送到第一计算机202的视频数据204是时域数据,而通过通讯链路207,从第一计算机202传送到第二计算机208的数据206是频域视频数据。编码的视频数据被显示在显示器213。图3显示了根据H.263标准(参见)执行基于块的图象编码方法的装置的略图。将编码的并具有被顺序数字化的图象的视频数据流提供到图象编码单元301。数字化的图象被再细分为宏块302,每一个宏块包括16×16象素。宏块302包括4个图象块303,304,305和306,每一个图象块包括8×8象素,它们的照度值(亮度值)被指定。此外,每一个宏块302包括具有被分配给该象素(色信息,色饱和度)的色度值的2个色度块307和308。图象中的块包括亮度值(=亮度),第一色度值和第二色度值。这时,亮度值,第一色度值和第二色度值被称作颜色值。图象块被提供给变换编码单元309。在差分图象编码时,从先前图象的图象块编码的值被减去在那时编码的图象块的值,只有差分构成信息310被提供给变换编码单元(离散余弦变换,DCT)309。为此,宏块302通过链路334被传信到运动估算单元329。在变换编码单元309,将被编码的图象块或差分图象块的频谱系数311被形成,并被提供给量化单元312。量化的频谱系数313在反馈路径上被提供给扫描单元314和反量化单元315。使用扫描方法,例如“z字形”扫描方法,在为此目的而提供的熵编码单元316中,对扫描的频谱系数332执行熵编码。熵编码的频谱系数作为编码的视频数据317通过一个信道,最好是电缆或无线通路,被传送到解码器。量化的频谱系数313的反向量化在反向量化单元315中被实行。以这种方法得到的频谱系数318被提供给反向变换编码单元319(反向离散余弦变换,IDCT)。重建的编码值(和差分编码值)320以差分构成模式被提供给加法器321。一旦运动补偿被进行,加法器321也接收从先前图象获得的图象块的编码值。加法器321用于形成储存在帧存储器323中的重建的图象块322。重建的图象块322的色度值324从帧存储器323被提供到运动补偿单元325。对于亮度值326,在提供的内插单元327中实现内插。该内插最好用于使包括在各个图象块中的亮度值扩大四倍。亮度值328不仅被提供到运动补偿单元3本文档来自技高网...

【技术保护点】
一种对具有象素的数字图像进行运动估算的方法,其中象素被分组到图象块;其中象素被分组,以便至少形成第一图象区域和第二图象区域;在第一检索区域,至少为在第一图象区域中的第一图象块实行第一运动估算,以便确定第一个运动矢量,利用它,通过 比较在前面图象中的第一图象块或后面图象中的第一图象块,第一图象块的移动被描述;其中,在第二检索区域,至少为在第二图象区域的第二图象块实行第二运动估算,以便确定第二个运动矢量,利用它,通过比较在前面的原来图象中的第二图象块或通过比较在后面 的后继图象中的第二图象块,第二图象块的移动被确定;其中,第一检索区域和第二检索区域大小不同。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:哲真番德尔格罗巴斯诺伯特欧特尔
申请(专利权)人:英芬能技术公司
类型:发明
国别省市:DE[德国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1