基于时域一致性约束的视频风格迁移方法技术

技术编号：21972633 阅读：43 留言：0更新日期：2019-08-28 01:43

本发明专利技术公开了一种基于时域一致性约束的视频风格迁移方法，主要解决现有技术在视频风格迁移中出现的闪烁、前后不连贯的问题。其实现方案为：1)获取视频数据集、风格图像，并离线计算光流信息；2)构建基于时域一致性约束的视频风格转换网络；3)利用视频数据集、风格图像以及光流信息训练风格转换网络模型，更新其各层的权值和偏置；4)将测试视频输入到训练好的风格转换网络模型中，输出结果即为风格化视频。本发明专利技术通过训练风格转换网络模型拟合输入视频与风格化视频之间的非线性映射关系，并以这种关系为指导对真实视频进行不同风格的渲染，提高了风格化视频的时域一致性和视觉效果，可用于视频渲染、风格转换的视频处理场景。

A Video Style Migration Method Based on Time Domain Consistency Constraints

全部详细技术资料下载

【技术实现步骤摘要】
基于时域一致性约束的视频风格迁移方法
本专利技术属于视频图像处理
，具体涉及一种视频风格迁移方法，可用于视频渲染、风格转换的视频处理场合。
技术介绍
十九世纪以来，不仅艺术家在探索如何创造出更优吸引力的艺术作品，图像处理领域的相关人员也在思考这个问题。随着深度学习的发展，2015年LeonA.Gatys等人在“ANeuralAlgorithmofArtisticStyle[J].ComputerScience,2015.”中，提出用深度神经网络模型提取图像的风格特征并将其赋予另一幅图像的算法，该算法被称为“图像风格迁移算法”。艺术作品的风格特征具体包括纹理特征、色彩特征、笔触特征、对比度特征及明暗光线的变化，是一个更为抽象的概念。近几年，关于图像及视频风格迁移的研究层出不穷。在过去，人们如果需要将一幅真实图像重画为具有艺术风格的合成图像，不仅需要一批训练有素的画家，还需要大量的时间和精力；如果要重画一段视频序列，所耗费的人力物力更是难以想象，因此，使用算法实现图像或视频的风格迁移具有重要的意义。目前，针对视频风格迁移问题，研究者们已经提出一些优秀的算法。根据算法的基本原理，可以将这些算法分为基于迭代优化的描述性方法和基于深度学习的生成式方法。基于迭代优化的描述性方法的基本思想是：首先建模并分别提取风格图像的风格信息和内容图像的内容信息，然后在目标图像中将两种信息结合，通过不断迭代优化生成的风格化图像，产生视觉效果良好的结果。目前此类方法最主要的局限性有两点，一是迭代优化过程中计算量十分巨大，非常耗时；二是随机初始化和损失函数的局部极小容易使输出的结果...

【技术保护点】
1.一种基于时域一致性约束的视频风格迁移方法，其特征在于，包括如下步骤：(1)根据视频训练集V和风格图像a，离线计算光流信息：(1a)获取视频训练集V和风格图像a，其中V中包含N组视频序列，每组视频序列Ι

【技术特征摘要】
1.一种基于时域一致性约束的视频风格迁移方法，其特征在于，包括如下步骤：(1)根据视频训练集V和风格图像a，离线计算光流信息：(1a)获取视频训练集V和风格图像a，其中V中包含N组视频序列，每组视频序列Ιn包括四幅图像，分别为一段视频的第1帧I1，第4帧I4，第6帧I6和第7帧I7，其中n＝{1,2,...,N}；(1b)通过变分光流法计算不同帧图像之间的光流信息和光流置信度信息Cn＝{c(1,7),c(4,7),c(6,7)}，其中表示第i帧到第7帧的光流信息，c(i,7)表示第i帧与第7帧之间的光流置信度矩阵，其中，i∈{1,4,6}；(2)构建基于时域一致性约束的视频风格迁移网络：(2a)设计风格转换网络，该网络包括依次连接的三个底层卷积层、五个残差模块、两个反卷积层和一个高层卷积层；将底层第一个卷积层的输出输入到第二个反卷积层中，将底层第二个卷积层的输出输入到第一个反卷积层中，形成两个跳跃连接；(2b)设置训练参数，随机初始化风格转换网络的权值σ0和偏置值β0；(3)训练基于时域一致性约束的视频风格转换网络模型：(3a)每次从视频训练集V中选择一组视频In，以及它对应的光流信息Wn、光流置信度信息Cn，作为训练样本，其中n＝{1,2,...,N}；(3b)将训练样本输入到风格转换网络生成风格化结果Pn，Pn＝{P1,P4,P6,P7}；(3c)计算风格化结果的总损失值LT：LT＝λsLs+λcLc+λvLv+λtLt，其中，Ls表示风格损失值、Lc表示内容损失值、Lv表示全变分损失值、Lt表示时域损失值，λs表示风格损失权重，λc表示内容损失权重，λv表示全变分损失权重，λt表示时域损失权重；(3d)使用总损失值LT训练风格转换网络模型，更新风格转换网络模型的权值σ和偏置值β；(3e)循环进行(3a)-(3d)对风格转换网络模型进行迭代优化训练，直到取完视频训练集V中所有的视频序列组，得到训练好的风格转换网络模型；(4)利用训练好的视频风格转换模型对测试视频进行风格迁移，即将一段测试视频输入到训练好的风格转换网络模型中，风格转换网络模型的输出即为具有时域一致性的风格化视频。2.根据权利要求1所述的方法，其特征在于，(2a)中的风格转换网络，其结构参数如下：第一底层卷积层的卷积核大小为9×9，卷积核数量为32，步长为1；第二底层卷积层的卷积核大小为3×3，卷积核数量为64，步长为2；第三底层卷积层的卷积核大小为3×3，卷积核数量为128，步长为2；第一残...

【专利技术属性】
技术研发人员：董伟生，张珍，谢雪梅，石光明，孙璐，
申请(专利权)人：西安电子科技大学，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人