一种基于3D卷积的视频超分辨率的方法技术

技术编号：36844565 阅读：13 留言：0更新日期：2023-03-15 16:18

本发明专利技术提供了一种基于3D卷积的视频超分辨率的方法,以此解决在现有方法中，包括以下步骤：S1.视频帧分组：从视频文件中，读取视频帧，并将视频帧分组；S2.3D卷积计算：基于3D卷积神经网络，构建特征提取算法模型；S3.基于对抗生成网络(GAN)，构建超分辨率算法模型。本发明专利技术方法超分算法因无法进行长时间跨度视频帧的依赖关系特征提取而导致视频帧参考信息缺失的问题。失的问题。失的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于3D卷积的视频超分辨率的方法

[0001]本专利技术涉及计算机视觉领域，特别地，涉及一种基于3D卷积的视频超分辨率的方法。

技术介绍

[0002]随着科学技术的发展，低分辨率的电子显示器，逐渐被2K/4K显示屏等超高清显示器所替代，消费者对超高清视频片源的需求也越来越高。但是，老旧影视因为早期拍摄设备落后等问题，导致没有超高清片源，严重影响观看体验。与此同时，基于深度神经网络的视频超分辨率算法，在将标清视频处理成超高清视频的技术应用上，得到广泛应用，取得了巨大进步。现有方法中，将视频解码后输入到神经网络，分辨率1920*1080的视频，100帧画面的时间跨度较长，解码后所需内存高达100*1920*1080*3*64≈4.6GB，现有的单层级的深度神经网络算法模型，难以处理如此大规模的数据，最终导致算法无法建立长时间跨度图像帧的相互依赖关系，进而导致视频帧参考信息的缺失。
[0003]解决上述问题的难度为：在现有技术中，一般将视频帧进行简单的卷积计算，或者用对抗生成网络结合光流算法，进行图像帧的依赖关系的特征提取，将提取到的特征作为当前视频帧的参考信息，但由于在超分应用中，视频帧数据量较大，导致难以建立长时间跨度的图像帧。
[0004]对视频的某一帧进行超分，输入的原始信息越多，意味着超分后的画面越接近真实情况；视频通用编码特性，视频前后十几帧，甚至几百帧，都与当前帧强相关；而视频解码后的数据量，是十分庞大的。解决上述问题的意义为：多层级3D卷积，可以将数据分批处理，并分批输入神经网络，特别是...

【技术保护点】

【技术特征摘要】
1.一种基于3D卷积的视频超分辨率的方法，其特征在于，包括以下步骤：S1.视频帧分组：从视频文件中，读取视频帧，并将所述视频帧分组；S2.3D卷积计算：基于3D卷积神经网络，构建特征提取算法模型；S3.基于对抗生成网络(GAN)，构建超分辨率算法模型。2.根据权利要求1所述的基于3D卷积的视频超分辨率的方法，其特征在于，在步骤S1中，使用通用编解码软件工具，读取所述视频文件，将所述视频帧解码成通用的数组矩阵，依次存放在内存中；选取视频帧的某一帧，并将所述视频帧前后相邻的m帧视频，依次分成n组；将每一组的视频帧进行拼接，以此作为每个层级3D卷积的输入数据。3.根据权利要求1所述的基于3D卷积的视频超分辨率的方法，其特征在于，在步骤S2中，构架一个多层级、...

【专利技术属性】
技术研发人员：魏文应，张伟民，安欣赏，肖铁军，张世雄，龙仕强，
申请(专利权)人：广东博华超高清创新中心有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人