颜色空间和用于视频的解码器制造技术

技术编号:13902312 阅读:109 留言:0更新日期:2016-10-25 21:48
因为我们所需要的是新的改进的且非常不同的颜色编码空间以用于能够可靠地编码目前浮现的高动态范围视频以用于诸如SIM2新时期之类的浮现的HDR显示器上的良好质量渲染,因此具有输入(308)的视频编码器(300)以从视频源(301)获取视频,其中像素颜色被编码在(XYZ)颜色编码中,视频编码器包括光电子转换单元(304),其布置成将像素颜色的亮度(Y)转换成具有预确定的代码分配函数(F)的明度(Y’),其特征在于视频编码器包括色品确定单元(310),其布置成利用数学色品定义编码具有预确定的阈值明度(E’)以下的明度的像素颜色的色品(u’’,v’’),其产出针对用于具有低于针对用于具有预确定的阈值明度(E’)以上的明度的像素颜色的特定色调的最大可编码饱和度(S_bH)的预确定的阈值明度(E’)以下的明度的像素颜色的特定色调的最大可编码饱和度(S_bL),以及针对具有特定色调和等于或大于预确定的阈值明度(E’)的明度的颜色的像素的恒定最大可编码饱和度(S_bH)。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及用于在新的颜色空间定义中编码视频(静止图像的集合)的方法和装置,以及具有更容易的解码的使用这样的颜色空间的解码器和解码方法。
技术介绍
自19世纪以来,已经在驱动坐标的RGB空间中表示了添加颜色重现以用于生成红色、绿色和蓝色原色光输出。因为为这些不同原色给出不同强度(亮度)是使所谓的色域(通过由可能的最大驱动(例如Rmax)定义的三个矢量获取的菱形形状)内的所有颜色对应于比如XYZ那样的某种通用颜色空间中的原色的方式。或者类似的,人们可以在从原色导出的另一线性空间(例如XYZ或UVW)中定义这样的颜色。这通过矢量的线性组合来完成,即人们可以通过用另一颜色空间定义中的旧的那些与转换矩阵相乘来计算新的颜色坐标。现在非常有用并且在历史上对于黑白电视而言必要的是具有消色差方向,其仅编码亮度Y,因为视觉系统也具有针对它的分离处理通道。这通过将色域放置在其尖端来获得,尖端是黑色的,其在图1a中通过黑色点来表示。颜色表示空间的色域当关联到参考监视器(或如果参考未经定义则信号被发送到的任何监视器)时是色域101。在该相同哲理中,人们还可以想象理论原色,其可以变成无限明亮的,从而导致圆锥体形状102。根据该原理定义若干颜色空间,特别地封闭的那些,因为它们对绘画也是有用的,其中人们必须混合纯色与白色和黑色,并且不能够高于纸面白色(例如Munsell颜色树、NCS和Coloroid是这样的(双)圆锥体颜色空间的示例,并且CIELUV和CIELAB是开放圆锥体)。在电视世界及其视频编码中,围绕该哲理的颜色空间的特定集合已经浮现。由于CRT具有总计达近似输入驱动电压的平方的输出亮度的gamma(并且这同样适用于分离的颜色通道),因此决定预补偿它并且向电视接收器发送信号,其被定义为线性相机信号的近似平方根(即例如R’为R的平方根,如由相机捕获的场景中的红色的量,并且在例如[0,0.7伏]的范围内)。现在由于人们需要在现有黑色和白色传输系统(NTSC或PAL)的顶部上构建,因此人们还利用使用消色差(“黑和白”)坐标的该哲理,以及承载信号的两个颜色信息R-Y、B-Y(然后可以从其导出G-Y)。线性系统中的Y将被计算为a*R+b*G+c*B,其中a,b和c是取决于原色的常量。然而,人们在所导出的坐标R’、G’、B’(即平方根信号)的非线性空间中进行这些简单的矩阵化计算。尽管最大可能色域的菱形形状不被这样的数学运算改变,但是其内的所有颜色的定位/定义改变。这意味着除其它之外Y’ = a*R’+b*G’+c*B’不再是传达所有颜色的精确亮度的实数亮度信号,这就是为何其被称为明度(在本文本中我们使用词语明度以用于沿消色差轴的所有所导出的/重定义的信号,其不是线性亮度,即与所使用的映射函数无关,即不一定是平方根,而是人们喜欢的Y到Y’的任何函数;并且我们然后将Y’视为表示颜色的亮度Y的技术编码)。这是所谓的恒定亮度问题,因为某种亮度信息不在Y’中而是在色度坐标Cr,Cb中。这些被定义为Cr= m*(R’-Y’)和Cb= n*(B’-Y’),并且在本文本中我们将它们称为色度,因为它们随颜色亮度增加而增长得更大(还使用术语彩度)。因此这些坐标具有关于它们的某种彩色方面,而且这与明亮度方面混合(在心理视觉上这本身不坏,因为颜色性也是随明亮度增长的外观因素)。如果人们精确地进行相同逆解码,问题将不会如此糟糕,但是编码在这样的系统中的颜色上的任何变换(其还形成当前MPEG标准的基础)创建问题,比如例如亮度和颜色误差。这发生在例如人们对色度子采样到较低分辨率时,并且人们必然应当避免在这样的空间中做出颜色分级,因为结果可以到处都是(尽管一些图像处理软件在这样的空间中工作)。因此这不是表示颜色的最方便的颜色空间,因为其具有人们必须迁就的问题。另一问题在于坐标可以增长得相当大,从而要求许多比特来用于编码,如果Rmax等非常大的话(或者换言之,色度空间需要许多比特以能够仍旧具有足够的精度以用于非常小的色度值),如关于HDR信号那样,尽管这可以通过定义从R等定义R’的强非线性明度曲线来部分地缓解。呈现给SMPTE的这样的编码空间的最新示例是YDzDx颜色空间,其可能需要至少10比特或优选地更多(12比特)以用于良好的(宽色域但精确的)颜色编码,并且这样大的字被硬件制造商视为不太方便的。第二种类型的颜色空间拓扑(图1b)浮现,尽管其中存在较少变型。如果我们将线性颜色投影到单位平面105,我们得到类型x=X/(X+Y+Z)和y=Y/(X+Y+Z)的透视变换(并且这同样适用于例如CIELUV)。此后z=1-x-y,我们仅需要两个这样的色品坐标。这样的空间的优点在于其将圆锥体变换成有限宽度柱体。即人们可以将单个色品(x,y)或(u,v)与一些光所光照的特定频谱反射曲线的对象相关联,并且该值然后独立于亮度Y,即其定义对象的颜色而与多少光落在其上无关。这样的颜色然后通常利用主波长和纯度来描述,或者更多人类量色调和饱和度。针对任何可能色调的最大饱和度是形成马蹄铁形边界103的单色颜色,并且针对特定添加显示(或颜色空间)的每一个色调的最大饱和度由RGB三角形确定。事实上,需要3D视图,因为添加重现或颜色空间的色域104是帐篷形状的,其中峰值白色W是其中所有颜色通道(即RGB局部显示子像素三元组中的局部像素)被最大地驱动的条件。基于色度的颜色空间,作为NTSC, BT.601和BT. 709的后代用于电视/视频,例如各种MPEG和其它数字压缩标准的Y’CrCb,已经在实践中足够好,尽管存在若干已知问题,特别地由于不当的非线性所致的各种颜色通道的混合(例如如果在颜色分量上做出某种操作则亮度改变,或者当人们仅想要改变饱和度(或更好彩度)时色调改变等)。基于色品的颜色空间,比如Yxy或Lu’v’,从未用于图像传输,仅用于科学图像分析。特别地,R. Mantiuk等人:“Lossy compression of high dynamic range images and video”Proc. SPIE-IS&T Electronic imaging Vol. 6057, 2006年1月16日,第1-10页,应对发现用于HDR图像或视频的有损编码的颜色空间。特别地他们设计了场景参照编码,其可以处置没有月亮的天空10exp(-5) nit和太阳表面100亿nit之间的所有亮度。这显然不能利用经典CIE 1976 Luv空间来处置,其被设计成处置比方说作为几百nit的100%反射白色与某个0.5%黑色(即LDR图像内容)之间的典型反射颜色。它们定义新的对数类型明度轴以用于颜色空间,其中明度尝试紧密地跟随人类视觉的特点并且因而具有第一阈值以下的第一线性部分,然后功率低行为,以及第二阈值以上的对数行为。基于此的logL-uv颜色模型是拓扑柱体形状色品表示的示例。WO 2010/104624也定义了类似对数类型明度,但是现在具有纯对数字符,其可以编码高达10000nit的实际亮度。它们通过在段落[0087]中的等式3A和3B中定义uv色品来从此做出颜色空间,即这使颜色空间也是柱状的。Larson G. W:“LogLuv encoding for f本文档来自技高网...

【技术保护点】
一种具有输入(308)的视频编码器(300)以从视频源(301)获取视频,其中像素颜色被编码在标准化设备独立线性颜色编码(XYZ)中,视频编码器包括光电子转换单元(304),其布置成将像素颜色的亮度(Y)转换成具有预确定的代码分配函数(F)的明度(Y’),其特征在于视频编码器包括色品确定单元(310),其布置成利用数学色品定义编码像素颜色的色品(u’’,v’’),其对于具有特定色调和预确定的阈值明度(E’)以下的明度的像素颜色产出最大可编码饱和度(S_bL),最大可编码饱和度是针对具有这样的色调和如根据用于明度的色品(u’’,v’’)平面中的颜色距利用等式S = sqrt((u ‑ uw)2 + (v ‑ vw)2)计算的预指定的白色点(u’’w,v’’w)的距离计算的预确定的阈值明度以下的明度的任何像素颜色的最高可能饱和度,其低于针对预确定的阈值明度(E’)以上的像素颜色明度的该特定色调的最大可编码饱和度(S_bH),并且其针对具有特定色调和等于或高于预确定的阈值明度(E’)的像素颜色产出恒定的最大可编码饱和度(S_bH)。

【技术特征摘要】
【国外来华专利技术】2014.02.21 EP 14156184.5;2014.07.09 US 62/0222981.一种具有输入(308)的视频编码器(300)以从视频源(301)获取视频,其中像素颜色被编码在标准化设备独立线性颜色编码(XYZ)中,视频编码器包括光电子转换单元(304),其布置成将像素颜色的亮度(Y)转换成具有预确定的代码分配函数(F)的明度(Y’),其特征在于视频编码器包括色品确定单元(310),其布置成利用数学色品定义编码像素颜色的色品(u’’,v’’),其对于具有特定色调和预确定的阈值明度(E’)以下的明度的像素颜色产出最大可编码饱和度(S_bL),最大可编码饱和度是针对具有这样的色调和如根据用于明度的色品(u’’,v’’)平面中的颜色距利用等式S = sqrt((u\ - u\w)2 + (v\ - v\w)2)计算的预指定的白色点(u’’w,v’’w)的距离计算的预确定的阈值明度以下的明度的任何像素颜色的最高可能饱和度,其低于针对预确定的阈值明度(E’)以上的像素颜色明度的该特定色调的最大可编码饱和度(S_bH),并且其针对具有特定色调和等于或高于预确定的阈值明度(E’)的像素颜色产出恒定的最大可编码饱和度(S_bH)。2.如权利要求1中所要求保护的视频编码器(300),其中针对具有阈值明度(E’)以下的明度的颜色的最大可编码饱和度(S_bL)作为像素颜色的明度(Y’)的单调函数而减小。3.如权利要求1或2中所要求保护的视频编码器(300),包括空间子采样单元(302),其布置成降低颜色信息的空间分辨率,所述单元布置成在线性(XYZ)像素颜色上执行通过因子(ss)的子采样,并且输出(XYZ)像素颜色的经子采样的图像作为用于色品确定单元(310)的输入。4.如上述权利要求中任一项中所要求保护的视频编码器(300),其中在8,10,12或14比特的字中编码明度。5.如上述权利要求中任一项中所要求保护的视频编码器(300),其中色品编码在6,7,8,9,10,11或12比特的字中以用于每一个色品坐标。6.一种视频编码方法,包括:– 从视频源(301)接收输入视频,其中像素颜色编码在标准化设备独立线性颜色编码(XYZ)中,– 通过将预确定的代码分配函数(F)应用于亮度(Y)以获得明度(Y’)来执行像素亮度(Y)的光电子转换,– 其特征在于方法还包括计算具有利用数学色品定义的预确定的阈值明度(E’)以下的明度(Y’)的像素颜色的色品(u’’,v’’),其产出针对用于具有预确定的阈值明度(E’)以下的明度的像素颜色的特定色调的最大可编码饱和度(S_bL),其低于针对用于具有预确定的阈值明度(E’)以上的明度的像素颜色的特定色调的最大可编码饱和度(S_bH),最大可编码饱和度是针对具有这样的色调和如根据用于明度的色品(u’’,v’’)平面中的颜色距利用等式S = sqrt((u\ - u\w)2 + (v\ - v\w)2)计算的预指定的白色点(u’’w,v’’w)的距离计算的预确定的阈值明度以下的明度的任何像素颜色的最高可能饱和度,以及针对具有特定色调和等于或大于预确定的阈值明度(E’)的明度的颜色的像素的恒定最大可编码饱和度(S_bH)。7.一种视频编码信号(S_im),其特征在于对于视频的图像,像素的颜色编码在由消色差明度(Y’)坐标和两个色品坐标(u’’,v’’)定义的颜色空间中,颜色空间被定义为具有以下性质:对于颜色空间的较低明度部分(LL),由具有阈值明度(E’)以下的明度的较低明度部分中的所有颜色定义,针对特定色调(h)和阈值明度(E’)以下的明度的颜色的最大可编码饱和度(S_bL)低于针对具有该特定色调和阈值明度(E’)以上的明度的颜色的最大可编码饱和度(S_bH),最大可编码饱和度是针对具有这样的色调和如根据用于明度的色品(u’’,v’’)平面中的颜色距利用等式S = sqrt((u\ - u\w)2 + (v\ - v\w)2)计算的预指定的白色点(u’’w,v’’w)的距离计算的预确定的阈值明度以下的明度的任何像素颜色的最高可能饱和度...

【专利技术属性】
技术研发人员:JHCJ斯特斯森RJ范登维勒尤坦JGR范莫里克R尼兰德
申请(专利权)人:皇家飞利浦有限公司
类型:发明
国别省市:荷兰;NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1