一种基于图像组编码的视频超分辨率方法技术

技术编号：37959675 阅读：12 留言：0更新日期：2023-06-30 09:34

本发明专利技术提供了一种基于图像组(GOP)编码的视频超分辨率方法，包括以下步骤：S1.截取图像组编码：从视频文件中，读取视频流中的图像组编码数据，并对图像组编码数据进行处理，得到算法模型需要的输入数据；S2.设计视频超分辨率算法模型：基于卷积神经网络、自注意力神经网络，构建实施超分辨率算法模型；以及S3.视频超分辨率算法模型训练与推理：基于通用深度神经网络训练方法训练算法，并提供视频超分辨率推理服务。本发明专利技术方法解决了现有方法中因视频帧解码数据量大、全连接网络计算量大等因素造成的超分算法无法输入长时间跨度图像帧的问题。题。题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图像组编码的视频超分辨率方法

[0001]本专利技术涉及计算机视觉领域，特别地，涉及一种基于图像组(GOP)编码的视频超分辨率方法。

技术介绍

[0002]随着手机、电脑、智能电视等终端设备的普及，以及硬件性能的不断提高，2K/4K显示屏逐渐称为主流电子屏幕，消费者对超高清视频的需求在不断的增加。但是，很多经典电影、电视剧，都没有高清片源。同时，早期个人录制的私人视频，对个体来说，具有很高的纪念价值，但早期的摄像机分辨率较低，画面模糊。与此同时，基于深度神经网络的人工智能技术得到广泛应用，其中就包括基于深度神经网络的视频超分辨率算法，其利用对抗网络和光流算法，生成超分辨率后的超高清图像。现有方法中，将视频解码后输入到神经网络，经计算后预测输出结果，现有方法中存在的问题是：解码后产生大量冗余数据，这些数据只是为了人眼感观效果而添加的，不是数据元信息。分辨率1920*1080的视频，100帧画面的时间跨度较长，解码后所需内存高达100*1920*1080*3*64≈4.6GB，而现有的深度神经网络算法模型，难以将如此大规模的数据作为算法模型的输入数据，最终导致算法难以输入长时间跨度的图像帧。而相同情况下，100帧对应的GOP编码，其数据流大小仅为6MB左右，远低于解码后的4.6GB数据量。
[0003]解决上述问题的难度为：当前主流算法，均为将视频帧解码之后，对解码后的一帧或者多帧视频，输入深度卷积神经网络，进行超分辨率计算。如果要输入更多视频帧，则需要设计新的算法模型，以便将数据输入到神经网络中。其难度...

【技术保护点】

【技术特征摘要】
1.一种基于图像组编码的视频超分辨率方法，其特征在于，包括以下步骤：S1.截取图像组编码：从视频文件中，读取视频流中的图像组编码数据，并对图像组编码数据进行处理，得到算法模型需要的输入数据；S2.设计视频超分辨率算法模型：基于卷积神经网络、自注意力神经网络，构建实施超分辨率算法模型；以及S3.视频超分辨率算法模型训练与推理：基于通用深度神经网络训练方法训练算法，并提供视频超分辨率推理服务。2.根据权利要求1所述的基于图像组编码的视频超分辨率方法，其特征在于，在步骤S1中，从视频文件中，读取视频流中的图像组编码的二进制数据流，并根据算法模型的数据结构要求，对数据流的数据结构进行预处理。3.根据权利要求1...

【专利技术属性】
技术研发人员：汪邦虎，魏文应，赵海英，李志永，张伟民，蔺吉驰，
申请(专利权)人：中关村视听产业技术创新联盟，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人