用于低码率视频压缩的微量处理制造技术

技术编号：35259563 阅读：18 留言：0更新日期：2022-10-19 10:18

一种系统包括：基于机器学习(ML)模型的视频编码器，被配置为：接收包括多个视频帧的未压缩视频序列；从该多个视频帧中确定第一视频帧子集和第二视频帧子集；编码该第一视频帧子集以产生第一压缩视频帧子集；和识别用于该第一压缩视频帧子集的第一解压缩数据。该基于ML模型的视频编码器进一步被配置为：编码该第二视频帧子集以产生第二压缩视频帧子集；和识别用于该第二压缩视频帧子集的第二解压缩数据。该第一解压缩数据专用于解码所述第一压缩视频帧子集而专用于该第二压缩视频帧子集，并且该第二解压缩数据专用于解码该第二压缩视频帧子集而不专用于该第一压缩视频帧子集。帧子集而不专用于该第一压缩视频帧子集。帧子集而不专用于该第一压缩视频帧子集。

全部详细技术资料下载

【技术实现步骤摘要】
用于低码率视频压缩的微量处理
[0001]相关申请的交叉引用
[0002]本申请要求在2021年4月8日提交的标题为“Neural Network Based Video Codecs”的第63/172,315号临时专利申请以及在2021年10月13号提交的标题为“Microdosing For Low Bitrate Video Compression”第63/255,280号临时专利申请的权益和优先权，其全部内容通过引用并入本申请。

技术介绍

[0003]视频内容代表总的因特网流量的大部分，并且随着空间分辨率帧率、视频的色深增加以及更多的用户采用流服务，视频内容预期会增加得更多。尽管现有编解码器已经实现了令人印象深刻的性能，但是它们已经被设计到这样的程度，即，进一步添加小的改进不可能满足未来的需求。因此，探索从根本上不同的方式以执行视频编码可能有利地产生具有改进的性能和灵活性的新类别的视频编解码器。
[0004]例如，使用训练好的机器学习(ML)模型(例如神经网络(NN))，以例如生成对抗网络(GAN)的形式来执行视频压缩的一个优点在于，它能够使得ML模型推断视觉细节，否则在要获取的数据传输方面将会代价较高。然而，模型尺寸在当前的技术发展水平的提案中仍然是重要的问题，并且现有的解决方案在解码侧需要显著的计算量。也就是说，现有的基于GAN的压缩框架的一个显著缺点是它们通常需要有时在私有数据集上训练的大型解码器模型。因此，将这些模型重新训练到它们的原始的性能通常是不可能的，并且即使当训练数据是可用的时，重新训练模型将是...

【技术保护点】

【技术特征摘要】
1.一种系统，包括：基于机器学习(ML)模型的视频编码器，被配置为：接收包括多个视频帧的未压缩视频序列；从所述多个视频帧中确定第一视频帧子集和第二视频帧子集；编码所述第一视频帧子集以产生第一压缩视频帧子集；识别用于所述第一压缩视频帧子集的第一解压缩数据；编码所述第二视频帧子集以产生第二压缩视频帧子集；和识别用于所述第二压缩视频帧子集的第二解压缩数据。2.根据权利要求1所述的系统，其中，识别所述第一解压缩数据包括，在所述第一视频帧子集的所述编码期间过度拟合所述第一解压缩数据，并且其中，识别所述第二解压缩数据包括，在所述第二视频帧子集的所述编码期间过度拟合所述第二解压缩数据。3.根据权利要求1所述的系统，其中所述第一视频帧子集包括视觉上彼此类似的视频帧，并且其中所述第二视频帧子集包括，与所述第一视频帧子集的所述视频帧相比视觉上更彼此类似的其它视频帧。4.根据权利要求1所述的系统，进一步包括基于ML模型的视频解码器；所述基于ML模型的视频编码器进一步被配置为：将所述第一压缩视频帧子集、所述第二压缩视频帧子集、所述第一解压缩数据和所述第二解压缩数据发送至所述基于ML模型的视频解码器；所述基于ML模型的视频解码器被配置为：接收所述第一压缩视频帧子集、所述第二压缩视频帧子集、所述第一解压缩数据和所述第二解压缩数据；使用所述第一解压缩数据解码所述第一压缩视频帧子集；和使用所述第二解压缩数据解码所述第二压缩视频帧子集。5.根据权利要求4所述的系统，其中，所述第一解压缩数据专用于解码所述第一压缩视频帧子集而不专用于所述第二压缩视频帧子集，并且所述第二解压缩数据专用于解码所述第二压缩视频帧子集而不专用于所述第一压缩视频帧子集。6.根据权利要求4所述的系统，其中，所述基于ML模型的视频解码器包括人工神经网络(NN)。7.根据权利要求4所述的系统，其中，所述基于ML模型的视频解码器包括微残差网络(Micro
‑
Residual
‑
Network，MicroRN)，并且其中所述第一解压缩数据与所述第二解压缩数据仅包含所述微残差网络的权重。8.根据权利要求4所述的系统，其中，所述基于ML模型的视频编码器包括高保真度压缩(High
‑
Fidelity Compression，HiFiC)编码器，并且其中，所述基于ML模型的视频解码器，相比于不使用所述第一解压缩数据和所述第二解压缩数据的HiFiC解码器，包括更少的参数。9.根据权利要求4所述的系统，其中，所述基于ML模型的视频编码器包含HiFiC编码器，并且其中所述基于ML模型的视频解码器被配置为，相比于不使用所述第一解压缩数据和所述第二解压缩数据的HiFiC解码器，实现更快的解码时间。10.根据权利要求4所述的系统，其中，所述第一解压缩数据仅被接收一次以用于所述
第一压缩视频帧子集的解码，并且其中所述第二解压缩数据仅被接收一次以用于所述第二压缩视频帧子集的解码。11.一种方法，由包括基于机器学习(ML)模型的视频编码器的系统所使用，所述...

【专利技术属性】
技术研发人员：A，
申请(专利权)人：苏黎世联邦理工学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人