用于视频通信系统中的差错弹性的改进系统和方法技术方案

技术编号:4474952 阅读:248 留言:0更新日期:2012-04-11 18:40
提供了用于视频通信系统中的差错弹性传输和随机接入的系统和方法。视频通信系统基于可用在视频通信系统中的单层可缩放视频、或具有时间缩放性的联播视频编码。视频信号传输中的一组视频帧或画面被指定为使用安全或高可靠性链路或通过重传技术可靠或有保证地递送到接收器。可靠递送的视频帧被用作用于在差错发生之后或针对随机接入使接收器与所传送视频信号重新同步的参考画面。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及视频数据通信系统。本专利技术尤其涉及用于提供视频会议应用中的 差错弹性的技术。
技术介绍
通过基于分组的现代通信网络(例如,基于网际协议(IP)的网络)在发送 方与接收方之间提供高质量数字视频通信至少由于此类网络上的数据传输通常是 以尽力为基础执行的这个事实而成为技术上的难题。现代通信网络中的传输差错通 常将其自身表现为分组丢失而非比特差错,后者是早期通信系统中的特性。分组丢 失常常是中间路由器中的拥塞的结果,而非物理层差错的结果。当在数字视频通信系统中发生传输差错时,确保接收器可从差错快速恢复并 返回传入视频信号的无差错显示是很重要的。然而,在典型数字视频通信系统中, 接收器的稳健性因传入数据被严重压縮以节约带宽这个事实而降低。此外,用在通 信系统中的视频压縮技术(例如,最新编解码器ITU-T H.264和H.263或者ISO MPEG-2和MPEG-4编解码器)可在连续视频分组或帧之间形成强的时间依存性。 具体地,运动补偿预测(例如,涉及P帧或B帧的使用)编解码器的使用形成其 中所显示的帧依赖于先前帧的帧依存性链。依存性链可一直扩展到视频序列的开 头。作为依存链的结果,给定分组的丢失可影响接收器处多个连续分组的解码。由于给定分组的丢失而导致的差错传播仅在"内"(I)刷新点或者完全不使用任何 时间预测的帧处。数字视频通信系统中的差错弹性要求在传送信号中有至少某一级别的冗余 度。然而,这种要求与力图消除或最小化所传送信号中的冗余度的视频压縮技术的 目的相反。在提供区分型服务的网络(例如,基于区分型服务IP的网络、租用线路上的 专用网等)上,视频数据通信应用可采用网络特征来以无损或近似无损的方式向接 收器递送视频信号数据的部分或全部。然而,在未提供区分型服务的任意尽力型网 络(诸如因特网)中,数据通信应用必须依赖其自身的特征来实现差错弹性。在文 本或字母数字数据通信中有用的已知技术(例如,传输控制协议一TCP)不适于视 频或音频通信,这对由人类接口需求所导致的较低的端对端延迟有额外的约束。例 如,TCP技术可用于文本或字母数字数据输送中的差错弹性。TCP保持重传数据直至确认所有数据被接收,即使其包括若干秒的延迟。然而,TCP不适用于现场或交互式视频会议应用中的视频数据输送,因为无限制的端对端延迟对于参与者而 言是无法接受的。视频通信系统中差错弹性的一方面涉及对压縮效率具有相当大的影响的随机 接入(例如,当接收方加入现行视频信号的传输时)。例如,随机接入的实例是加 入视频会议的用户,或者调谐至广播的用户。这样的用户将必须在传入比特流信号 中寻找开始解码或要与编码器同步的合适的点。随机接入点是从该点开始任何传播 差错终止的有效的差错弹性特征(或差错恢复点)。因此,提供良好的随机接入支 持的特定编码方案通常具有提供较快速差错恢复的差错弹性技术。然而,逆过程依 赖于关于差错弹性技术被设计要解决的差错的持续时间和范围的特定假设。差错弹 性技术可假定某些状态信息在接收器处发生差错时可用。在此情形中,差错弹性技 术不确保良好的随机接入支持。在用于数字电视系统(数字电缆TV或卫星TV)的MPEG-2视频编解码器中, 以周期间隔(通常为0.5秒)使用I画面来实现快速切换成流。然而,I画面显著 大于其P或B对应物(通常大3到6倍),并由此被避免使用,在低带宽和/或低 延迟应用中尤其如此。在诸如视频会议的交互式应用中,请求帧内更新的概念通常被用于差错弹性。 在操作中,更新涉及从接收方对发送方的、关于使得解码器被同步的内画面传输的 请求。此操作的带宽开销是显著的。另外,当分组差错发生时,也存在此开销。如果分组丢失是由拥塞导致的,则使用内画面只会恶化拥塞问题。另一种用于差错稳健性的传统技术——在过去用于减轻由IDCT实现(例如,在H.261标准中)中的失配而导致的漂移——是周期性地编码每个宏块帧内模式。 H.261标准要求每132次强制帧内编码传送一宏块。随着强制要被编码为给定帧中帧内的宏块的百分比的增大,编码效率下降。 相反,当此百分比较低时,从分组丢失恢复的时间增加。强制帧内编码过程要求额 外的精力以避免运动相关漂移,该漂移由于必须避免某些运动矢量值——即使它们 是最有效的——而进一步限制了编码器的性能。除传统之外,单层编解码器、分层或可缩放编码是多媒体数据编码中的公知 技术。可縮放编码用于生成以带宽效率方式共同代表给定媒体的两个或多个"经縮 放"比特流。可縮放性可以多个维度——即时间、空间和质量(也称为SNR"信 噪比"可縮放性)——来提供。例如,视频信号可以CIF或QCIF分辨率且每秒 7.5、 15和30帧(fps)的帧率下的不同层来可縮放地编码。取决于编解码器的结 构,空间分辨率和帧率的任何组合可从编解码器比特流获得。与不同层相对应的比 特可作为单独的比特流传送(即,每层一个流)或它们可在一个或多个比特流中被 复用在一起。为了便于本文的描述,与给定层相对应的经编码比特可称为该层的比 特流,即使各个层被复用且在单个比特流中传送。专门设计成提供可縮放特征的编 解码器包括例如MPEG-2 (也称为ITU-T H.262的ISO/IEC 13818-2)和目前开发的 H.264可縮放视频编码扩展(称为ITU-T H.264附录G或MPEG-4第10部分SVC)。 在共同转让国际专利申请No. PCT/US06/028365——"SYSTEM AND METHOD FOR SCALABLE AND LOW-DELAY VIDEOCONFERENCING USING SCALABLE VIDEO CODING (用于使用可縮放视频编码的可縮放和低延迟视频会 议的系统和方法)"——中描述了为视频通信专门设计的可縮放视频编码(SVC) 技术。注意,即使并非专门设计成可縮放的编解码器也可以在时间维度呈现可縮放 性的特性。例如,考虑MPEG-2 Main Profile (主型)编解码器——DVD和数字TV 环境中使用的非可縮放编解码器。此外,假定以30 fps操作的编解码器以及使用 IBBPBBPBBPBBPBB (周期N45帧)的GOP结构。通过连续消除B画面,接着 消除P画面,就能得到总共三个时间分辨率30fps (包括所有画面类型)、10 fps (仅有I和P)以及2 fps (仅有I)。连续消去过程导致可解码的比特流,因为 MPEG-2 Main Profile编解码器被设计成使得P画面的编码不依赖于B画面,并且 类似的I画面的编码不依赖于其它P或B画面。在以下,具有时间可縮放特征的单层编解码器被认为是可縮放视频编码的特例,因此被包括在术语可縮放视频编码 中,除非另外明确指明。可縮放编解码器通常具有锥形比特流结构,其中组成比特流之一 (称为"基 层")在恢复某种基本质量的原始媒体时是必需的。连同基层一起使用一个或多个 剩余比特流(称为"增强层")提升了所恢复媒体的质量。增强层中的数据丢失是 容许的,但是基层中的数据丢失会导致所恢复媒体的显著失真或完全失败。可縮放编解码器提出了类似于由单层编解码器针对差错弹性和随机接入所提 出的那些挑战。然而,可縮放编解码器的编码结构具有单层视频编解码器中不存在 的独特本文档来自技高网...

【技术保护点】
一种用于在基于分组的通信网络上在传送端点或服务器与一个或多个接收端点或服务器之间进行媒体通信的系统,所述系统包括: 编码器,其将所传送的媒体编码为具有包括最低时间层的多个不同层的线程化编码结构中的画面,其中每一画面与画面索引号相关联,  其中与单个画面相对应的数据被划分成一个或多个个体数据分组并在其中传送, 其中个体数据分组包括指示以下的数据元素: 对于最低时间级画面,标识所述画面的序号, 对于其它时间级画面,对按照解码次序最近的最低时间级画面的序 号的引用,以及 对于所有画面,‘开始’标志和‘结束’标志,其分别指示所述个体数据分组是否包含所述画面的第一或最后数据部分,从而接收端点或服务器在收到所述个体数据分组之际能通过检查在所述接收端点或服务器处是否已收到与所述被引用的画面索引 相对应的所述画面的所有数据部分来检测最低时间级画面的部分的丢失,以使得其分组序号不包含间隙,并且其中此所述第一数据部分的‘开始’位被置位,而此所述最后数据部分的‘结束’位被置位。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:S希伯利A埃尔法泽阿迪斯J伦诺克斯
申请(专利权)人:维德约股份有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1