利用基于块的深度学习模型的视频编解码器制造技术

技术编号：38390206 阅读：13 留言：0更新日期：2023-08-05 17:43

本公开涉及利用基于块的深度学习模型的视频编解码器。本实施方案提供了一种视频编解码器，其在通过利用深度学习模型处理视频块期间，通过层叠或封装相应的YUV视频块来生成超级块，然后将生成的超级块输入到深度学习模型中，其中，在深度学习模型内部的卷积期间，根据构成超级块的YUV块的特征，对视频块进行不同的处理。的处理。的处理。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】利用基于块的深度学习模型的视频编解码器

[0001]本专利技术涉及利用基于块的深度学习模型的视频编解码器。

技术介绍

[0002]本部分中的陈述仅提供与本专利技术有关的
技术介绍
信息，并不一定构成现有技术。
[0003]由于视频数据与音频数据或静止影像数据相比具有较大的数据量，视频数据需要大量的硬件资源(包括存储器)来存储或发送未经压缩处理的视频数据。
[0004]相应地，编码器通常用于压缩并存储或发送视频数据。解码器接收压缩的视频数据，解压接收到的压缩的视频数据，并且播放解压的视频数据。视频压缩技术包括H.264/AVC、高效率视频编码(High Efficiency Video Coding，HEVC)和多功能视频编码(Versatile Video Coding，VVC)，所述多功能视频编码(VVC)比HEVC的编码效率提高了大约30％或更多。
[0005]然而，由于影像大小、分辨率和帧速率逐渐增加，要编码的数据量也在增多。相应地，需要一种与现有的压缩技术相比提供更高的编码效率和改善的影像增强效果的新的压缩技术。
[0006]近年来，基于深度学习的图像处理技术已经应用于现有的编码基本技术。通过将基于深度学习的图像处理技术应用于现有的编码技术(特别是，诸如帧间预测、帧内预测、环内滤波、变换等的压缩技术)，可以提高编码效率。代表性的应用示例包括基于由深度学习模型生成的虚拟参考帧的帧间预测，以及基于去噪模型的环内滤波。因此，需要进一步采用基于深度学习的图像处理技术来提高影像编码/解码的编...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种由计算装置执行的用于基于深度学习技术处理视频块的方法，所述方法包括：获得视频输入块，所述视频输入块包括Y块、U块和V块，所述Y块、U块和V块分别具有采样率格式为4:2:0或4:4:4的Y信号、U信号和V信号；通过堆叠或组合Y块、U块和V块来生成输入块；将输入块输入到至少一个深度学习模型；通过基于至少一个或更多个深度学习模型执行卷积运算来从输入块生成输出块；以及从输出块生成视频输出块。2.根据权利要求1所述的方法，其中，生成输入块包括：当Y信号、U信号和V信号为4:2:0格式时，扩大U块和V块以在大小上匹配Y块；以及堆叠Y块、扩大的U块和扩大的V块。3.根据权利要求2所述的方法，其中，扩大包括：通过上下或从左到右镜像U块并且组合由镜像产生的四个U块来重复U块4次，从而扩大U块以在大小上匹配Y块。4.根据权利要求2所述的方法，其中，扩大包括：将U块居中，然后通过填充U块的外周来扩大U块以在大小上匹配Y块，同时用与U块同位的Y块的值填补U块的外周。5.根据权利要求2所述的方法，其中，扩大包括：将U块定位在扩大的U块的一个象限中，然后利用与U块同位的Y块的值来填补扩大的U块的剩余象限。6.根据权利要求1所述的方法，其中，生成输入块包括：当Y信号、U信号和V信号为4:2:0格式时，将Y块四等分以在大小上匹配U块；以及堆叠四等分的Y块、U块和V块。7.根据权利要求6所述的方法，其中，四等分包括：在水平和竖直方向上抽取构成Y块的样本，以生成四等分的Y块。8.根据权利要求1所述的方法，其中，生成输入块包括：当Y信号、U信号和V信号为4:2:0格式时，通过利用U块和V块生成大小与Y块相等的超级块；以及堆叠超级块和Y块。9.根据权利要求8所述的方法，其中，生成超级块包括：上下组合U块和V块，然后在水平方向上对U块和V块进行上采样，或者从一侧到另一侧组合U块和V块，然后在竖直方向上对U块和V块进行上采样。10.根据权利要求1所述的方法，其中，生成输入块包括：当Y信号、U信号和V信号为4:2:0格式时，通过组合Y块、U块和V块来生成超级块。11.根据权利要求1所述的方法，其中，生成输入块包括：当Y信号、U信号和V信号为4:4:4格式时，通过堆叠Y块、U块和V块来生成输入块。12.根据权利要求1所述的方法，其中，将输入块输入包括：...

【专利技术属性】
技术研发人员：姜制远，朴胜煜，
申请(专利权)人：起亚株式会社梨花女子大学校产学协力团，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人