计算用于编辑HDR内容的动态元数据制造技术

技术编号:36590579 阅读:27 留言:0更新日期:2023-02-04 17:55
对视频内容进行编辑的系统和方法包括:接收输入视频数据;将输入视频数据转换成预定格式;为经转换的视频数据的帧生成多个初始元数据值,多个初始元数据值包括:第一元数据值,第一元数据值与并非根据包括帧的内容计算的第一固定值相对应;第二元数据值,第二元数据值与帧的平均光亮度值相对应;以及第三元数据值,第三元数据值与并非根据内容计算的第二固定值相对应,其中,第一元数据值、第二元数据值和第三元数据值包括由解码器用于在显示器上呈现经解码图像的信息。呈现经解码图像的信息。呈现经解码图像的信息。

【技术实现步骤摘要】
【国外来华专利技术】计算用于编辑HDR内容的动态元数据
[0001]相关申请的交叉引用
[0002]本申请要求均于2020年6月3日提交的欧洲专利申请第20178044.2号和美国临时申请第63/034,006号的优先权,这两个申请中的每一个都通过引用以其全文并入本文。

技术介绍
1.

[0003]本申请总体上涉及图像;更具体地,本申请涉及结合视频内容生成用于显示管理的元数据。
[0004]2.
技术介绍

[0005]如本文所使用的,术语“动态范围(DR)”可以涉及人类视觉系统(HVS)感知图像中的强度范围(例如,光亮度、亮度)的能力,例如,从最暗的黑色(深色)到最亮的白色(高光)。从这个意义上说,DR与“参考场景的(scene

referred)”强度有关。DR还可以涉及显示设备充分或近似渲染特定阔度(breadth)的强度范围的能力。从这个意义上说,DR与“参考显示的(display

referred)”强度有关。除非在本文的描述中的任何一点明确指定特定的意义具有特定的意思,否则应该推断为该术语可以在任一意义上例如可互换地使用。
[0006]如本文所使用的,术语“高动态范围(HDR)”涉及跨越HVS的大约14个至15个或更多数量级的DR阔度。实际上,相对于HDR,人类可以同时感知强度范围内的广泛阔度的DR可能会被稍微截短。如本文所使用的,术语“增强动态范围”(EDR)或“视觉动态范围”(VDR)可以单独地或可互换地与这种DR相关:该DR可在场景或图像内由包括眼运动的HVS感知,允许场景或图像上的一些光适性变化。如本文所使用的,EDR可以涉及跨越5个到6个数量级的DR。因此,虽然相对于真实场景参考的HDR可能稍微窄一些,但EDR可以表示宽DR阔度并且也可以被称为HDR。
[0007]在实践中,图像包括一个或多个颜色分量(例如,RGB、亮度Y以及色度Cb和Cr),其中,在量化的数字系统中,每个颜色分量由每像素n位的精度表示(例如,n=8)。n≤8的位深度(例如,彩色24位JPEG图像)可以用于标准动态范围(SDR)的图像,而n>8的位深度可以考虑用于增强动态范围(EDR)的图像,以避免等高线伪影和阶梯伪影。除了整数数据类型外,还可以使用比如由工业光魔公司(Industrial Light and Magic)开发的OpenEXR文件格式等高精度(例如,16位)浮点格式来存储并分发EDR和高动态范围(HDR)图像。
[0008]给定显示器的参考电光传递函数(EOTF)表征输入视频信号的颜色值(例如,光亮度)与由显示器产生的输出屏幕颜色值(例如,屏幕光亮度)之间的关系。例如,ITU Rec.ITU

R BT.1886年,“Reference electro

optical transfer function for flat panel displays used in HDTV studio production”(2011年3月)基于阴极射线管(CRT)的测量特性限定了平板显示器的参考EOTF,其内容通过引用以其全文并入本文。在给定了视频流的情况下,关于其EOTF的信息通常作为元数据嵌入比特流中。
[0009]许多消费类桌面显示器以200cd/m2至300cd/m2(“尼特”)的最大光亮度渲染非HDR
内容,而消费类高清和超高清电视机(“HDTV”和“UHD TV”)的最大光亮度为300尼特至500尼特。因此,这种显示器输出代表了与HDR或EDR相关的低动态范围(LDR),也被称为SDR。随着HDR或EDR内容的可用性由于捕获设备(例如,相机)和HDR显示器(例如,杜比实验室公司(Dolby Laboratories)的PRM

4200专业参考监视器或索尼Trimaster HX 31"4K HDR主监视器)两者的发展而增加,HDR内容可以被颜色分级并且被显示在支持更高动态范围(例如,从700尼特到5000尼特或更高)的HDR显示器上。这种显示器可以使用支持高光亮度能力(例如,0尼特到10,000尼特)的替代EOTF来限定。这种EOTF的示例在SMPTE ST 2084:2014“High Dynamic Range EOTF of Mastering Reference Displays”中被限定,其内容通过引用以其全文并入本文。
[0010]如本文所使用的,术语“显示管理”表示将第一动态范围(例如,1000尼特)的输入视频信号映射到第二动态范围(例如,500尼特)的显示器所需的处理(例如,色调和色域映射)。显示管理过程的示例在以下文献中描述:R.Atkins等人于2014年2月13日提交的PCT申请序列第PCT/US 2014/016304号('304申请)(“Display management for high dynamic range video”),该PCT申请通过引用以其全文并入本文。显示管理可以由输入元数据来辅助或控制,该输入元数据由传入内容的源生成并被复用到编码比特流中。
[0011]在本节中描述的方法是可以追寻的方法,但不一定是先前已经设想到或追寻的方法。因此,除非另有指明,否则不应该认为本节中所描述的任何方法仅凭其纳入本节就可被视为现有技术。类似地,除非另有表示,否则关于一种或多种方法所认定的问题不应该基于本节而被认为在任何现有技术中被认定。

技术实现思路

[0012]本公开的各个方面涉及用于生成元数据的设备、系统和方法,元数据可以用于提供改善的视频质量、改善的时间稳定性、低计算要求和减少的延迟。
[0013]在本公开的一个方面,提供了一种对视频内容进行编辑的方法,方法包括:接收输入视频数据;将输入视频数据转换成预定格式,由此生成经转换的视频数据;为经转换的视频数据的帧生成多个初始元数据值,多个初始元数据值包括:第一元数据值,第一元数据值与并非根据包括帧的内容计算的第一固定值相对应;第二元数据值,第二元数据值与帧的平均光亮度值相对应;以及第三元数据值,第三元数据值与并非根据内容计算的第二固定值相对应,其中,第一元数据值、第二元数据值和第三元数据值包括由解码器用于在显示器上呈现经解码图像的信息。
[0014]在本公开的另一个方面,提供了一种视频编辑系统,视频编辑系统包括:存储器;以及处理器,处理器被配置为使视频编辑系统进行以下操作:接收输入视频数据;将输入视频数据转换成预定格式,由此生成经转换的视频数据;为经转换的视频数据的帧生成多个初始元数据值,多个初始元数据值包括:第一元数据值,第一元数据值与并非根据包括帧的内容计算的第一固定值相对应;第二元数据值,第二元数据值与帧的平均光亮度值相对应;以及第三元数据值,第三元数据值与并非根据内容计算的第二固定值相对应。
[0015]在本公开的另一个方面,提供了一种对视频内容进行编辑的方法,方法包括:接收输入视频数据;将输入视频数据转换成预定格式,由此生成经转换的视频数据;为经转换的视频数据的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种对视频内容进行编辑的方法,包括:接收输入视频数据;将所述输入视频数据转换成预定格式,所述预定格式在动态范围方面不同于所述输入视频数据的格式,由此生成经转换的视频数据;为所述经转换的视频数据的帧生成多个初始元数据值,所述多个初始元数据值包括:第一元数据值,所述第一元数据值与并非根据包括所述帧的内容计算的第一固定值相对应,其中,所述第一固定值与所述内容的最小允许光亮度值相对应;第二元数据值,所述第二元数据值与所述帧的平均光亮度值相对应;以及第三元数据值,所述第三元数据值与并非根据所述内容计算的第二固定值相对应,其中,所述第二固定值与所述内容的最大允许光亮度值相对应,其中,所述第一元数据值、所述第二元数据值和所述第三元数据值包括由解码器用于在显示器上呈现经解码图像的信息。2.根据权利要求1所述的方法,其中,所述预定格式是标准动态范围格式,可选地其中,所述输入视频数据采用高动态范围格式。3.根据权利要求1或2所述的方法,进一步包括:在生成所述多个初始元数据值之前,对所述经转换的视频数据应用空间平滑操作。4.根据权利要求3所述的方法,其中,应用所述空间平滑操作包括对所述经转换的视频数据进行二次采样。5.根据权利要求3或权利要求4所述的方法,其中,应用所述空间平滑操作包括将所述经转换的视频数据缩减到更小尺寸。6.根据权利要求1至5中任一项所述的方法,进一步包括:输出分发视频数据,所述分发视频数据包括与所述帧相对应的视频数据部分、所述第一元数据值、所述第二元数据值和所述第三元数据值。7.根据权利要求1至6中任一项所述的方法,其中,所述预定格式是感知量化器高动态范围格式。8.一种存储指令的非暂态计算机可读介质,所述指令在由计算机系统的处理器执行时使所述计算机系统执行包括根据权利要求1至7中任一项所述的方法的操作。9.一种视频编辑系统,包括:存储器;以及处理器,所述处理器被配置为使所述视频编辑系统进行以下操作:接收输入视频数据,将所述输入视频数据转换成预定格式,所述预定格式在动态范围方面不同于所述输入视频数据的格式,由此生成经转换的视频数据,为所述经转换的视频数据的帧生成多个初始元数据值,所述多个初始元数据值包括:第一元数据值,所述第一元数据值与并非根据包括所述帧的内容计算的第一固定值相对应,其中,所述第一固定值与所述内容的最小允许光亮度值相对应,第二元数据值,所述第二元数据...

【专利技术属性】
技术研发人员:R
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1