使用用于帧间预测的基于深度学习的环路滤波器的视频编码方法和设备技术

技术编号：39510508 阅读：6 留言：0更新日期：2023-11-25 18:46

公开了用于使用用于帧间预测的基于深度学习的环路滤波器的视频编码方法和设备

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用用于帧间预测的基于深度学习的环路滤波器的视频编码方法和设备

[0001]本公开涉及使用用于帧间预测的基于深度学习的环路滤波器的视频编码方法和设备
。

技术介绍

[0002]该部分中的陈述仅提供与本公开相关的背景信息，并且不一定构成现有技术
。
[0003]由于视频数据与音频或静态图像数据相比具有大量数据，因此视频数据在没有压缩的处理的情况下需要大量硬件资源
(
包括存储器
)
来存储或传输视频数据
。
[0004]因而，编码器通常用于压缩和存储或传输视频数据
。
解码器接收压缩的视频数据，对接收到的压缩的视频数据进行解压缩，并播放解压缩后的视频数据
。
视频压缩技术包括
H.264/AVC、
高效视频编码
(HEVC)
和通用视频编码
(VVC)
，其与
HEVC
相比具有约
30
％或更大的改进的编码效率
。
[0005]然而，由于图像尺寸
、
分辨率和帧率逐渐增加，所以要编码的数据量也增加
。
因而，需要提供比现有压缩技术更高的编码效率和改进的图像增强效果的新压缩技术
。
[0006]近来，基于深度学习的图像处理技术已经被应用于现有的编码基本技术
。
编码效率可通过将基于深度学习的图像处理技术应用于现有编码技术来改善，具体来说，例如压缩技术，例如帧间

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.
一种用于视频质量增强的设备，包括：输入单元，配置为获得已经被重构的当前帧和已经被解码的量化参数；量化参数预处理器，配置为通过使用基于深度学习的嵌入函数从所述量化参数计算嵌入矢量，或者配置为通过使用基于深度学习的估计模型来估计由于所述量化参数而引起的图像失真；以及去噪器，配置为通过使用基于深度学习的去噪模型从所述当前帧去除量化噪声来生成增强帧，其中，所述去噪模型利用所计算的所述嵌入矢量或所估计的所述图像失真来生成所述增强帧
。2.
根据权利要求1所述的设备，其中，所述当前帧是由视频编码设备根据帧间预测重构的
P
帧
(
预测帧
)
或
B
帧
(
双向预测帧
)。3.
根据权利要求1所述的设备，其中，所述嵌入函数包括：嵌入层和多个全连接层
。4.
根据权利要求1所述的设备，其中，所述嵌入函数将所述量化参数的全部或部分
、
用于计算率失真的拉格朗日因子
、
所述当前帧的临时层
、
所述当前帧的类型或其任何组合作为输入
。5.
根据权利要求1所述的设备，其中，所述去噪模型包括
RB(
残差块
)
和卷积层的级联结构并且使用所述级联结构来生成所述增强帧，并且每个
RB
是在输入和输出之间具有跳跃路径的卷积块
。6.
根据权利要求5所述的设备，其中，所述去噪器配置为将由所述卷积层中的预设卷积层生成的特征乘以所述嵌入矢量的绝对值
。7.
根据权利要求1所述的设备，其中，所述去噪模型包括：
U
网络，所述
U
网络是配置为用于从所述当前帧生成内核的偏移的深度学习模型；采样器，配置为通过使用所述偏移对所述当前帧进行采样；卷积层，配置为从输入图像
、
所述
U
网络的输出特征图和采样的当前帧生成校准内核；以及输出卷积层，配置为通过使用所述校准内核将卷积应用于所述采样的当前帧以生成所述增强帧
。8.
根据权利要求7所述的设备，其中，所述去噪器配置为将所述校准内核乘以所述嵌入矢量的绝对值
。9.
根据权利要求1所述的设备，其中，所述估计模型包括：
U
网络，配置为从所述当前帧提取噪声图；分类器，配置为在
...

【专利技术属性】
技术研发人员：姜制远，金娜莹，李订炅，朴胜煜，
申请(专利权)人：起亚株式会社梨花女子大学校产学协力团，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人