用信号通知逆离散余弦变换的最大动态范围制造技术

技术编号:5461104 阅读:338 留言:0更新日期:2012-04-11 18:40
本发明专利技术描述用信号通知可在解码一组经编码媒体数据时产生的逆离散余弦变换(IDCT)输出值的最大动态范围的多种技术。根据这些技术,编码装置可产生媒体文件,所述媒体文件包括与一组一个或一个以上视频帧相关联的经编码媒体数据。所述媒体文件还可包括范围指示元,所述范围指示元指示在解码所述经编码媒体数据时产生的IDCT输出值的所述最大动态范围。接收所述媒体文件的解码装置可在解码所述经编码媒体数据之前使用所述范围指示元来确定是否解码所述经编码媒体数据。举例来说,当所述解码装置不能够产生在IDCT输出值的所述所指示范围中的IDCT输出值时,所述解码装置可不解码所述经编码媒体数据。

【技术实现步骤摘要】
【国外来华专利技术】相关申请案交叉参考本申请案主张2006年10月23日提出申请的第60/862,591号美国临时申请案的权益,所述申请案的全部内容以引用方式并入本文中。
本专利技术涉及计算机图形,且明确地说涉及图形数据的压缩。
技术介绍
许多现有的图像及视频编码标准采用压缩技术以允许将高分辨率图像及视频作为相对紧缩文件或数据流来存储或传输。此类编码标准包括联合照片专家组(“JPEG”),移动图片专家组(“MPEG”)-1、MPEG-2、MPEG-4部分2,H.261、H.263、H.264/先进视频编码(“H.264/AVC”)及其它图像或视频编码标准。根据这些标准中的许多标准,使用“空间”编码来压缩视频帧。这些帧可以是原始帧(即,i-帧)或可以是使用运动补偿的临时编码过程产生的残余帧。在空间编码期间,帧被分为相等大小的像素块。举例来说,可将未经压缩的帧分为一组8x8像素块。对于每一像素块来说,像素分量被分离为像素分量值矩阵。举例来说,可将每一像素块划分为Y像素分量值的矩阵、U像素分量值的矩阵及V像素分量值的矩阵。在此实例中,Y像素分量值指示亮度值且U及V像素分量值表示色度值。此外,在空间编码期间,将正离散余弦变换(“FDCT”)应用于将要编码的帧中的像素分量值的每一矩阵。理想的一维FDCT由下式定义:t(k)=c(k)Σn=0N-1s(n)cosπ(2n+1)k)2N]]>其中s是N个原始值的阵列,t是N个经变换值的阵列且系数c可由下式给出:c(0)=1/N,c(k)=2/N]]>当1≤k≤N-1时。理想的二维FDCT是由以下公式定义:t(i,j)=c(i,j)Σn=1N-1Σm=0N-1s(m,n)cosπ(2m+1)i2Ncosπ(2n+1)j2N]]>其中s是N个原始值的阵列,t是N个经变换值的阵列,以及c(i,j)由c(i,j)=c(i)c(j)给出且其中c(k)定义为在一维情况下。-->当使用FDCT变换像素块分量值时,产生系数矩阵。举例来说,可接着使用哈弗曼(Huffman)或算术代码来量化及编码此系数矩阵。视频位流表示在一系列未经压缩视频帧中对视频帧中的所有像素块分量值的执行此过程的经组合结果。可通过反转此过程来从视频位流中导出未经压缩的视频帧。明确地说,解压缩位流视频中的每一系数矩阵且逆量化经解压缩的值以导出经逆量化系数矩阵。接着将逆离散余弦变换(“IDCT”)应用于每一经逆量化系数矩阵以导出像素分量值矩阵。理想的一维IDCT由下式定义:s(n)=Σk=0N-1c(k)t(k)cosπ(2n+1)k2N]]>其中s是N个原始值的阵列,t是N个经变换值的阵列,且系数c由下式给出c(0)=1/N,c(k)=2/N]]>其中1≤k≤N-1。理想的二维IDCT由以下公式定义:s(m,n)=Σi=0N-1Σj=0N-1c(i,j)t(i,j)cosπ(2m+1)i2Ncosπ(2n+1)j2N]]>接着将像素分量值所得矩阵再汇编为像素块,且再汇编这些像素块以形成经解码的视频帧。如果所述经解码视频帧是帧内编码帧,那么所述视频帧现在完全被解码。然而,如果所述经解码视频帧是帧间编码帧,那么所述经解码视频帧只不过是经解码的残余帧。通过使用与所述经解码视频帧相关联的运动向量建造经预测帧且接着将所述经预测帧添加到经解码的残余帧,来产生完整的帧。
技术实现思路
本文描述用以用信号传输可在解码一组经编码媒体数据时产生的逆离散余弦变换(“IDCT”)输出值的最大动态范围的多种技术。根据这些技术,编码装置可产生媒体文件,所述媒体文件包括与一组一个或一个以上视频帧相关联的经编码媒体数据。所述媒体文件还可包括指示在解码所述经编码媒体数据时产生的IDCT输出值的最大动态范围的范围指示元。接收所述媒体文件的解码装置可在解码所述经编码媒体数据之前,使用所述范围指示元来确定是否解码所述经编码媒体数据。举例来说,当所述解码装置不能产生在IDCT输出值的所指示范围中的IDCT输出值时,所述解码装置可不解码所述经编码媒体数据。在一个方面,一种方法包含:借助解码模块接收媒体对象,所述媒体对象包括表示一组一个或一个以上视频帧的经编码媒体数据及指示与所述经编码媒体数据相关联的IDCT输出值的最大动态范围的范围指示元。所述方法还包含确定与所述经编码媒体数据相关联的IDCT输出值的最大动态范围是否包括在给定范围外的IDCT输出值。此外,所述方法包含当与所述经编码媒体数据相关联的IDCT输出值的最大动态范围不包括在所述给定范围外的IDCT输出值时,基于所述经编码媒体数据使用第一-->操作来产生一组IDCT输出值。另外,所述方法包含使用所述组IDCT输出值来产生与所述组视频帧中的视频帧相关联的经重建视频帧。所述方法还包含致使媒体呈现模块呈现所述经重建视频帧。在另一方面,一种方法包含从解码装置接收指示IDCT输出值的最大动态范围的消息。另外,所述方法包含响应于接收所述消息而产生表示一组一个或一个以上视频帧的第一组经编码媒体数据,其中与所述第一组经编码媒体数据相关联的IDCT输出值不包括在所指示范围外的IDCT输出值。所述方法还包含将所述第一组经编码媒体数据输出到所述解码装置。在再一方面,一种装置包含接收媒体对象的通信接口,所述媒体地响包括表示一组一个或一个以上视频帧的经编码媒体数据及指示与所述经编码媒体数据相关联的IDCT输出值的最大动态范围的范围指示元。所述装置还包含范围检查模块,其确定与所述经编码媒体数据相关联的IDCT输出值的最大动态范围是否包括在给定范围外的IDCT输出值。另外,所述装置包含初级逆变换模块,当与所述经编码媒体数据相关联的IDCT输出值的最大动态范围不包括在所述给定范围外的IDCT输出值,所述初级逆变换模块基于所述经编码媒体数据使用第一操作来产生一组IDCT输出值。所述装置还包含图片重建模块,其使用所述组IDCT输出值来产生与所述组视频帧中的视频帧相关联的经重建视频帧。此外,所述装置包含呈现驱动器,其致使媒体呈现模块呈现所述经重建视频帧。在又一方面,一种装置包含通信接口,其从解码装置接收指示IDCT输出值的最大动态范围的消息。所述装置还包含编码模块,其响应于接收所述消息而产生表示一组一个或一个以上视频帧的第一组经编码媒体数据,其中与所述第一组经编码媒体数据相关联的IDCT输出值不包括在所指示范围外的IDCT输出值。所述通信接口将所述第一组经编码媒体数据输出到所述解码装置。在又一方面,一种装置包含用于接收媒体对象的装置,所述媒体对象包括表示一组一个或一个以上视频帧的经编码媒体数据及指示与所述经编码媒体数据相关联的IDCT输出值的最大动态范围的范围指示元。所述装置还包含用于确定与所述经编码媒体数据相关联的IDCT输出值的最大动态范围是否包括在给定范围外的IDCT输出值的装置。另外,所述装置包含用于当与所述经编码媒体数据相关联的IDCT输出值的最大动态范围不包括在所述给定范围外的IDCT输出值时基于所述经编码媒体数据使用第一操作来产生一组IDCT输出值的装置。此外,所述装置包含用于使用所述组IDCT输出值来产生与所述组视频本文档来自技高网
...

【技术保护点】
一种方法,其包含: 借助解码模块接收媒体对象,所述媒体对象包括表示一组一个或一个以上视频帧的经编码媒体数据及指示与所述经编码媒体数据相关联的逆离散余弦变换(“IDCT”)输出值的最大动态范围的范围指示元; 确定与所述经编码媒体数 据相关联的IDCT输出值的所述最大动态范围是否包括在给定范围外的IDCT输出值; 当与所述经编码媒体数据相关联的IDCT输出值的所述最大动态范围不包括在所述给定范围外的IDCT输出值时,使用第一操作以基于所述经编码媒体数据来产生一组I DCT输出值; 使用所述组IDCT输出值来产生与所述组视频帧中的视频帧相关联的经重建视频帧;及 致使媒体呈现单元呈现所述经重建视频帧。

【技术特征摘要】
【国外来华专利技术】US 2006-10-23 60/862,591;US 2007-10-2 11/865,9151、一种方法,其包含:借助解码模块接收媒体对象,所述媒体对象包括表示一组一个或一个以上视频帧的经编码媒体数据及指示与所述经编码媒体数据相关联的逆离散余弦变换(“IDCT”)输出值的最大动态范围的范围指示元;确定与所述经编码媒体数据相关联的IDCT输出值的所述最大动态范围是否包括在给定范围外的IDCT输出值;当与所述经编码媒体数据相关联的IDCT输出值的所述最大动态范围不包括在所述给定范围外的IDCT输出值时,使用第一操作以基于所述经编码媒体数据来产生一组IDCT输出值;使用所述组IDCT输出值来产生与所述组视频帧中的视频帧相关联的经重建视频帧;及致使媒体呈现单元呈现所述经重建视频帧。2、如权利要求1所述的方法,其进一步包含:当与所述经编码媒体数据相关联的IDCT输出值的所述最大动态范围包括在所述给定范围外的IDCT输出值时,请求替代的媒体对象;及接收所述替代的媒体对象,其中所述替代的媒对象包括表示所述组视频帧的替代的经编码媒体数据,其中与所述替代的经编码媒体数据相关联的IDCT输出值的最大动态范围不包括在所述给定范围外的IDCT输出值。3、如权利要求1所述的方法,其进一步包含当与所述经编码媒体数据相关联的IDCT输出值的所述最大动态范围包括在所述给定范围外的IDCT输出值时,使用第二操作以基于所述经编码媒体数据来产生所述组IDCT输出值。4、如权利要求1所述的方法,其中所述方法进一步包含:对所述经编码媒体数据执行熵解码操作来产生与所述组视频帧相关联的一组经量化系数矩阵;及至少部分地通过逆量化所述组经量化系数矩阵中的经量化系数来产生与所述组视频帧相关联的经逆量化系数矩阵;且其中使用所述第一操作来产生所述组IDCT输出值包含通过将IDCT应用于所述经逆量化系数矩阵来产生所述组IDCT输出值。5、如权利要求1所述的方法,其中使用所述组IDCT输出值来产生经重建视频帧包含:产生包括所述IDCT输出值的经重建残余图片;通过使用与所述组视频帧相关联的运动数据执行运动补偿操作来产生与所述组视频帧相关联的经预测图片;及使用所述经重建残余图片及所述经预测图片来产生经重建图片。6、一种装置,其包含:通信接口,其接收媒体对象,所述媒体对象包括表示一组一个或一个以上视频帧的经编码媒体数据及指示与所述经编码媒体数据相关联的逆离散余弦变换(“IDCT”)输出值的最大动态范围的范围指示元;范围检查模块,其确定与所述经编码媒体数据相关联的IDCT输出值的所述最大动态范围是否包括在给定范围外的IDCT输出值;初级逆变换模块,当与所述经编码媒体数据相关联的IDCT输出值的所述最大动态范围不包括在所述给定范围外的IDCT输出值时,所述初级逆变换模块使用第一操作以基于所述经编码媒体数据来产生一组IDCT输出值;图片重建模块,其使用所述组IDCT输出值来产生与所述组视频帧中的视频帧相关联的经重建视频帧;及呈现驱动器,其致使媒体呈现单元呈现所述经重建视频帧。7、如权利要求6所述的装置,其进一步包含:范围协商模块,当与所述经编码媒体数据相关联的IDCT输出值的所述最大动态范围包括在所述给定范围外的IDCT输出值时,所述范围协商模块请求替代的媒体对象;且其中所述通信接口接收所述替代的媒体对象,其中所述替代的媒体对象包括表示所述组视频帧的替代的经编码媒体数据,其中与所述替代的经编码媒体数据相关联的IDCT输出值的最大动态范围不包括在所述给定范围外的IDCT输出值。8、如权利要求6所述的装置,其进一步包含次级逆变换模块,当与所述经编码媒体数据相关联的IDCT输出值的所述最大动态范围包括在所述给定范围外的IDCT输出值时,所述次级逆变换模块使用第二操作以基于所述经编码媒体数据来产生所述组IDCT输出值。9、如权利要求6所述的装置,其中所述装置进一步包含:熵解码模块,其对所述经编码媒体数据执行熵解码操作以产生与所述组视频帧相关联的一组经量化系数矩阵;及逆量化模块,其至少部分地通过逆量化所述组经量化系数矩阵中的经量化系数来产生与所述组视频帧相关联的一组经逆量化系数;且其中所述初级逆变换模块通过将IDCT应用于所述组经逆量化系数矩阵来产生所述组IDCT输出值。10、如权利要求6所述的装置,其中所述装置进一步包含:残余重建模块,其产生包括所述IDCT输出值的经重建残余图片;及运动补偿模块,其通过使用与所述组视频帧相关联的运动数据执行运动补偿操作来产生与所述组视频帧相关联的经预测图片;且其中所述图片重建模块使用所述经重建残余图片及所述经预测图片来产生所述经重建视频帧。11、如权利要求6所述的装置,其中所述通信接口是无线通信接口。12、一种方法,其包含:从解码装置接收指示逆离散余弦变换(“IDCT”)输出值的最大动态范围的消息;响应于接收到所述消息,产生表示一组一个或一个以上视频帧的第一组经编码媒体数据,其中与所述第一组经编码媒体数据相关联的IDCT输出值不包括在IDCT输出值的所述所指示最大动态范围外的IDCT输出值;及将所述第一组经编码媒体数据输出到所述解码装置。13、如权利要求12所述的方法,其中所述方法进一步包含:产生表示所述组视频帧的第二组经编码媒体数据;计算与所述第二组经编码媒体数据相关联的IDCT输出值的最大动态范围;产生媒体对象,所述媒体对象包括所述第二组经编码媒体数据及指示与所述第二组经编码媒体数据相关联的IDCT输出值的所述最大动态范围的范围指示元;及将所述媒体对象输出到所述解码装置。14、如权利要求12所述的方法,其中产生所述第一组经编码媒体数据包含...

【专利技术属性】
技术研发人员:尤里列兹尼克
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1