一种基于样本数据集优化的视频超分辨率方法技术

技术编号：34092159 阅读：16 留言：0更新日期：2022-07-11 21:27

发明专利技术为一种基于样本数据集优化的视频超分辨率方法，其步骤如下：首先通过内容分类模块，判断目标视频的内容所属分类；其次，依据内容的分析结果，实时挑选样本数据，并将挑选后的样本数据输入至映射关系模型，得到实时挑选增量数据集；随后将挑选的样本数据集进行训练，得到预训练的网络模型；紧接着将挑选后的增量数据集进行训练，得到训练完成的超分辨率重建模型；最后，将待超分辨率重建的视频图像输入进训练好的超分辨率重建网络模型之中，得到超分辨率重建的视频图像，完成视频图像超分辨率重建任务。本发明专利技术的优点为，构建了一个轻量级的视频超分辨率方法，它提升了在视频超分辨率中最大化样本的训练效率，用最少的样本达到最好的重建效果。到最好的重建效果。到最好的重建效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于样本数据集优化的视频超分辨率方法

[0001]本专利技术涉及图形处理领域，特别是一种基于样本数据集优化的视频超分辨率的方法。

技术介绍

[0002]对于视频监控领域，如何得到感兴趣的高分辨率目标图像是该领域的热点和难点问题。相比于提升获取高分辨率图像的硬件设备，采用图像超分辨率算法重建的方法成本低并且较易实现。超分辨率技术(Super Resolution,SR) 是从给定的低分辨率(LR)图像中恢复高分辨率(HR)图像的过程，是计算机视觉领域的一个重要分支。近年来，图像超分辨率的相关研究发展迅速，尤其是深度学习的飞速发展，但是现有的这些超分辨率算法如VDSR、LapSRN、MSRN等，采用提升网络的参数量以及细化卷积神经网络的架构来提升图像的重建效果，无法适用于广大设备受限的现实场景。为了追求视频图像重建的效果提升训练模型的泛化能力，现有的算法需要采用大量的训练数据，并且需要内容较为独立的训练数据。常用的超分辨率数据集，如Div2K、Flick2K等数据集都包含了 1000及以上张2K分辨率的图像，ImageNet甚至包含了350万张图片，且训练集中的包含的图像类别有人物、动物、风景等。虽然相关性较弱的训练数据集有利于提升算法的泛化能力避免过拟合，但与此同时也降低了模型的重建效果。
[0003]在过去的几年里，深度学习的方法在诸如机器视觉、语音识别及自然语言处理等几个领域获得重大突破，得到广泛的关注与应用。搭建基于深度学习的模型是常用来解决复杂问题的现代方法，然后该方法不利的一面是，为了训练一个到令...

【技术保护点】

【技术特征摘要】
1.一种基于样本数据集优化的视频超分辨率方法，其特征在于，包括以下步骤：步骤S1：建立一个视频图像内容分类器，用于识别与分类输入视频图像的内容,同时对输入的原始低分辨率视频图像进行上采样预处理形成预处理的视频图像；步骤S2：将视频图像内容分类器的输出结果和带有分类标签的样本数据集共同输入内容关系模型，依据内容关系模型的数据分析结果，输出挑选后的样本数据集；步骤S3：将经过上采样预处理后的视频图像与步骤S2中挑选后的样本数据集共同输入映射关系模型，依据映射关系模型的数据分析结果，输出挑选后的原始视频图像数据集；步骤S4：将挑选后的样本数据集输入到初始超分辨率网络模型之中，进行超分辨率重建网络模型预训练，形成预训练后的网络模型；步骤S5：将步骤S3挑选后的原始视频图像数据集输入至步骤S4的预训练后的超分辨率网络模型，通过增量学习训练，生成增量数据调整的超分辨率网络模型，从而完成超分辨率重建网络模型训练，形成训练完成的网络模型；步骤S6：将原始低分辨率视频图像输入至训练完成的网络模型中，输出高分辨率的视频图像，完成超分辨率重建工作。2.根据权利要求1所述的一种基于样本数据集优化的视频超分辨率的方法，其特征在于：所述步骤S1中，视频图像内容分类器采用经典的ResNet152网络架构构建而成；ResNet152包含五个部分，分别是：conv1，conv2_x，conv3_x，conv4_x，conv5_x，其中conv1是个7x7x64的卷积层，conv2_x,conv3_x，conv4_x，conv5_x分别是3、8、36、3个building block，共计50个，每个block为3层，所以有50x 3＝150层，最后有个用于分类的fc层，共计152层；ResNet152网络利用现有的样本数据集进行预训练，网络模型训练完成后即可得到一个经典的视频图像内容分类器。3.根据权利要求1所述的一种基于样本数据集优化的视频超分辨率的方法，其特征在于：所述步骤S2具...

【专利技术属性】
技术研发人员：张清池，
申请(专利权)人：福建八萃网络科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人