用于基于学习的图像/视频编解码的整形器制造技术

技术编号:41267059 阅读:20 留言:0更新日期:2024-05-11 09:22
从输入视频信号接收在输入域中表示的输入图像。对所述输入图像执行前向整形以生成在整形图像域中表示的经前向整形的图像。执行非整形编码操作以将经整形的图像编码成经编码的视频信号。所述非整形编码操作中的至少一个是利用ML模型来实施的,所述ML模型先前已在先前训练阶段中用一个或多个训练数据集中的训练图像进行了训练。使得经编码的视频信号的接收设备从经前向整形的图像生成重建图像。

【技术实现步骤摘要】
【国外来华专利技术】

本公开总体上涉及图像处理操作。更具体地,本公开的实施例涉及视频编解码器。


技术介绍

1、如本文所使用的,术语“动态范围(dr)”可以涉及人类视觉系统(hvs)感知图像中的强度范围(例如,光亮度、亮度)的能力,例如,从最暗的黑色(深色)到最亮的白色(高光)。从这个意义上说,dr与“参考场景的(scene-referred)”强度有关。dr还可以涉及显示设备充分或近似渲染特定阔度(breadth)的强度范围的能力。从这个意义上说,dr与“参考显示的(display-referred)”强度有关。除非在本文的描述中的任何一点明确指定特定的意义具有特定的意思,否则应该推断为所述术语可以在任一意义上例如可互换地使用。

2、如本文所使用的,术语“高动态范围(hdr)”涉及跨越人类视觉系统(hvs)的大约14至15个或更多数量级的dr阔度。实际上,相对于hdr,人类可以同时感知强度范围中的广泛阔度的dr可能会被稍微截短。如本文所使用的,术语“增强动态范围(edr)或视觉动态范围(vdr)”可以单独地或可互换地与这种dr相关:所述dr可在场景或图像内由包括眼运本文档来自技高网...

【技术保护点】

1.一种方法,包括:

2.如权利要求1所述的方法,其中,经前向整形的图像是通过利用第一卷积神经网络执行的所述前向整形生成的,所述第一卷积神经网络使用空间核大小为1像素×1像素的卷积滤波器将所述输入图像中三个颜色通道中的每个输入码字前向整形为N个通道中的相应的经前向整形的码字,其中,N表示不小于三的整数;其中,所述重建图像是通过利用第二卷积神经网络执行的逆向整形生成的,所述第二卷积神经网络使用空间核大小为1像素×1像素的第二卷积滤波器将所述输入图像中所述N个通道中的每个经前向整形的码字逆向整形为所述三个颜色通道中的相应的重建码字;其中,所述第一卷积神经网络包括所述输入图像中的输...

【技术特征摘要】
【国外来华专利技术】

1.一种方法,包括:

2.如权利要求1所述的方法,其中,经前向整形的图像是通过利用第一卷积神经网络执行的所述前向整形生成的,所述第一卷积神经网络使用空间核大小为1像素×1像素的卷积滤波器将所述输入图像中三个颜色通道中的每个输入码字前向整形为n个通道中的相应的经前向整形的码字,其中,n表示不小于三的整数;其中,所述重建图像是通过利用第二卷积神经网络执行的逆向整形生成的,所述第二卷积神经网络使用空间核大小为1像素×1像素的第二卷积滤波器将所述输入图像中所述n个通道中的每个经前向整形的码字逆向整形为所述三个颜色通道中的相应的重建码字;其中,所述第一卷积神经网络包括所述输入图像中的输入码字到所述n个通道中的经前向整形的码字的非线性映射。

3.如权利要求1或2所述的方法,其中,所述非整形编码操作包括以下各项中的一项或多项:光流分析、运动矢量编码、运动矢量解码、运动矢量量化、运动补偿、残差编码、残差解码或残差量化。

4.如权利要求1至3中任一项所述的方法,其中,所述前向整形是作为在所述非整形编码操作之前执行的环外图像处理操作来执行的。

5.如权利要求1至3中任一项所述的方法,其中,所述前向整形是作为整体环内图像处理操作的包括所述非整形编码操作的一部分来执行的。

6.如权利要求5所述的方法,其中,所述整体环内图像处理操作是编码操作。

7.如权利要求1至6中任一项所述的方法,其中,经前向整形的图像的图像元数据部分是由经编码的视频信号携带的图像元数据的一部分;其中,所述图像元数据部分包括以下各项中的一项或多项:用于所述前向整形的...

【专利技术属性】
技术研发人员:尹鹏浦方君吕陶然A·阿罗拉苏冠铭陈涛S·T·麦卡锡W·J·胡萨克
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1