用于立体视频编码的视图偏移估算制造技术

技术编号:3617268 阅读:175 留言:0更新日期:2012-04-11 18:40
使用较低层图象不等预测加强层图象的立体视频传送系统通过将较低层图象右移位以补偿人眼摄象物镜的间隔使较低层图象与加强层图象更匹配。在编码器处根据加强层和较低层图象间的最小平均误差或最小平均平方误差确定加强层和较低层图象间的最佳偏移x。较低层图象的x个最右象素列被删除,较低层图象的x个最左列被填充以右移较低层图象x个象素而获得不等预测中的基准图象。在译码器处,如果可得到,偏移值x被恢复和并重建基准帧。(*该技术在2018年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种用于编码立体视频数据的装置和方法。特别是,本专利技术表示了一种用于估算在相同暂时参考点处的右和左频道之间景物最佳偏移的系统。所述系统减少了不均匀性(即跨频道或跨层)预测的运动矢量搜索范围,从而改善了编码效率。由于数字技术能够传送比模拟技术更高质量的信号,所以,数字技术使向消费者传送视频和音频服务产生了革命性的变化,并能够提供以前所不能得到的特性。数字系统对于经过电缆电视网络或经过卫星向电缆电视分支机构和/或直接向家庭卫星接收机传送的信号是特别有益的。在这种系统中,用户经过接收机接收所述数字数据并经过解扰器解压缩和译码所述数字数据,以便重新结构原来的视频和音频信号。所述数字接收机包括在这个处理中使用的一个微机和多个存储器存储元件。提供低成本接收机的同时还要提供高质量视频和音频需要限制被处理数据的数量。此外,可以得到的用于传送数字信号的带宽也可能受到实际约束、现存通信协议和政府调节的限制。因此,必须研制各种帧内数据压缩方案以取得在特定视频图象(例如帧)中相邻象素中空间相关性的优点。此外,帧间压缩方案通过使运动补偿数据和块匹配运动估算算法采用在连续帧相应区域之间的暂时相关性的优点。在这种情况下,通过识别在最接近模拟所述当前块的在前块中的一个块,确定用于在一个图象的当前图象中每个块的运动矢量。然后,通过将表示相应块对之间差别的数据和识别相应块对所需的运动矢量一起传送,能够在译码器处重新结构所述整个当前图象。当与诸如离散余弦变换(DCT)的以块为基础的空间压缩技术相结合时,块匹配运动估算算法是特别有效的。因此,对诸如在1995年12月在ISO/IEC JTC1/SC29/WG11 N1088(ITU-Treconmmendation H.262)文本中描述、名称为“对13818-2“多级视图文件”的建议绘图修正”的运动图象专家组(MPEG)MPEG-2多视图轮廓(MVP)系统以及在1996年7月的文本ISO/IEC JTC1/SC29/WG11 N1277中描述的MPEG-4验证模型(VM)版本3.0的建议立体视频传送格式越来越感兴趣。上述两种文本在这里都作为参考。立体视频提供同一图象的轻度偏移以便产生具有较大场深度的组合图象,借此,建立三维(3D)效果。在这种系统中,两个摄象机可以被置于相距2.5英寸或65mm的位置处以在两个分离的视频信号上记录一个事件。所述摄象机的间隔近似等于人眼左和右之间的距离,即眼部之间的间隔。此外,利用立体视频摄象记录器,两个物镜被设置在一个摄象记录头上和因此例如当扫视一个图象时两个物镜同步运动。两个视频信号可以被传送和在一个接收机处重新组合,以产生具有相当于普通人类视觉的场深度的图象。此外还可以提供其他的效果。MPEG MVP系统包括以多路复用信号形式传送的两个视频层。第一,基础(例如较低)层表示三维目标的左视图,第二,增强(例如辅助或较高)层表示所述目标的右视图。由于右和左视图具有同一图象的特性和彼此相对稍有偏移,所以,在基础层和增强层的视频图象之间具有很大程度的相关性。所述相关性能够被用于相对于所述基层压缩增强层数据,借此减少在增强层中需要被传送的数据量,以保持给定的图象质量。所述图象质量通常对应于视频数据的量化级。所述MPEG MVP系统包括三种视频图象,具体地说是帧内编码图象(I-图象)、预测编码图象(P-图象)和双向预测编码图象(B-图象)。另外,当基础帧调节帧或场结构视频顺序时,所述增强层仅调节帧结构。一个I-图象完全描述一个单一的视频图象而部参考任何其他图象。对于经过改进的误差隐蔽,运动矢量能够包括一个I-图象。由于在基础层中的P-图象和B-图象都是根据I-图象预测的,所以,在所述I-图象中的误差具有对显示视频有较大影响的电位。此外,在增强层中的图象能够根据在基础层中的图象利用已知是不均匀性预性的跨层预测处理进行预测。根据一帧到一层内另一帧的预测已知是暂时预测。在基础层内,在在前I或P图象的基础上预测P图象。所述参考是从较早的I-图象或P-图象到未来的P-图象并已知是正向预测。所述B-图象是根据前面最接近的I或P图象和后面最接近的I或P图象预测的在所述增强层中,一个P-图象可以根据(a)在所述增强层中的最接近译码图象、(b)根据显示顺序的最接近基础层图象、(c)根据显示顺序的下一个较低层图象被预测。通常当根据显示顺序的最接近基础层图象是一个I-图象时,使用情况(b)。此外,在增强层中的B-图象可以使用(d)用于正向预测的最接近译码增强层图象和按照显示顺序的最接近较低层图象、(e)用于正向预测的最接近译码增强层图象和用于反相预测的按照显示顺序的下一个较低层图象、或(c)用于正向预测并按照显示顺序的最接近较低层图象和用于反相预测并按照显示顺序的下一个较低层图象进行预测。当按照显示顺序的最接近较低层图象是一个I-图象时,只有那个I-图象被用于预测编码(例如,将不是正向预测)。注意,只有预测模式(a)、(b)和(d)被包含在所述MPEG MVP系统内。所述MVP系统是MPEG暂时扩充编码的子集,它包含模式(a)-(f)中的每一个。在一个任选的结构中,所述增强层只具有P和B图象,而没有I-图象。对未来图象(即还没有被显示的图象)的参考被称之为反向预测。注意,在增强层内没有反向预测发生。因此,所述增强层图象以显示顺序传送。在增加压缩速率的情况下,反相预测是非常有用的。例如,在开门的情况下,当前图象可以在其中所述门已经被打开的未来图象的基础上预测在门后面有甚麽东西。B-图象发生更多的压缩,同时也存在更多的误差。为了删除误差传播,B-图象决不能根据在所述基础层内的其他B-图象进行预测。P-图象发生很少的误差和很少的压缩。I-图象发生最少的压缩,但能够提供随机存取。例如,对于不等预测,无论是较低层自己本身还是与增强层参考图象相结合,较低层图象都被用做与增强层图象相关的参考图象。通过搜索预定搜索区域在所述参考图象中发现最佳匹配图象对所述增强层图象进行运动补偿,使用所述参考图象最佳匹配图象的象素对增强层图象进行微分编码。利用微分编码的象素数据传送用于规定相对于编码增强层区域的最佳匹配图象相对位移的运动矢量,以允许在一个译码器处重新结构所述增强层图象。所述处理可以在逐个宏数据块的基础上发生。但是,当所述运动矢量搜索区域增加时,所述处理和对不等预测的存储器存储要求是增加的。因此,出现了无效变量长度编码(例如,霍夫曼编码)这导致了更加昂贵和/或更慢的编码和译码装置。因此,利用一个系统改善立体视频系统中不等预测增强层图象的编码效率是有益的。所述系统应当计及立体视频摄象机人眼距离,以提供一个与所述增强层图象最匹配的移动的较低层图象。所述系统应当与各种图象尺寸、包括矩形以及任意形状图象相兼容。所述系统还应当与诸如MPEG-1、MPEG-2、MPEG-4、H.261和H.263等各种现存和建议的视频编码标准相兼容。所述系统还应当在重新结构一个参考帧的过程中提供由一个译码器使用的偏移值的传送。所述系统还应当对那些不允许通过在所述译码器处减少矢量搜索范围传送偏移值的视频标准生效。所述技术应当适用于静止图象和所述图象的顺序。本专利技术提供一种具有上述和其他优点的系统。根据本专利技术,本文档来自技高网...

【技术保护点】
一种使用在立体视频信号的较低层中的较低层图象预测在该立体视频信号的加强层中的加强层图象的方法,包括如下步骤:根据(a)在所述加强层图象和所述较低层图象的象素值之间的最小平均误差;(b)在所述加强层图象和所述较低层图象的象素之间的最小 平均平方误差之一确定在所述加强层图象和所述较低层图象之间的最佳偏移x;和根据所述最佳偏移移位所述较低层图象,以获得在不等预测所述加强层图象中使用的一个参考图象。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:陈学敏
申请(专利权)人:通用仪器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1