一种基于长短期记忆网络的换脸视频检测方法技术

技术编号:24708976 阅读:21 留言:0更新日期:2020-07-01 00:06
本发明专利技术公开了一种基于长短期记忆网络的换脸视频检测方法,该检测方法包括视频帧提取、图像特征提取、长短期记忆网络训练测试。其中,视频帧提取负责提取视频片段中的关键帧及其之后的连续多帧图像,然后对图像中人脸区域进行裁剪,并使用高通滤波对人脸图像进行处理,提取人脸图像中的细节信息;利用在ImageNet图像分类数据集中训练好的Xception卷积神经网络对图像进行特征提取,将卷积神经网络的输出作为图像的特征,然后将各帧图像提取到的特征拼接为特征序列,输入到长短期记忆网络进行训练,最终得到一个高精度的换脸视频分类器。本发明专利技术充分利用了伪造视频中存在的帧间不一致性,大大提高了伪造视频的检测精度,取得了很好的分类效果。

【技术实现步骤摘要】
一种基于长短期记忆网络的换脸视频检测方法
本专利技术属于模式识别
,尤其涉及一种基于长短期记忆网络的换脸视频检测方法。
技术介绍
目前,视频作为通信的重要内容,在人们的生活中起着重要的作用。同时,视频也能够作为法庭中的证据。然而近年来,由于深度学习等技术的发展,针对视频的伪造技术已经达到了一个很高的水平。其中,深度伪造技术可以通过在原始视频中插入合成人脸来生成人脸伪造视频。一方面,这类换脸视频被大量用于色情视频,在很大程度上对被换脸人物的形象造成极大伤害,另一方面,这类换脸视频能够使人们产生误判,甚至影响到人们的决策。深度伪造视频已经成为一个严重的社会问题,对社会造成了严重的负面影响。现有的伪造人脸检测技术主要分为如下两类:第一类是基于帧内图像瑕疵的检测方法,该方案通过提取视频的每一帧,对视频的每一帧进行预处理后,提取相关特征进行检测,然后计算视频的伪造率,从而判断视频是否为伪造视频。现有的检测方法主要利用换脸过程造成的图像瑕疵进行检测,这些瑕疵主要包括将合成人脸嵌入到原视频中造成的合成边缘色差、分辨率不一致等问题。然而,在分辨率较低的视频中,视频瑕疵很容易被掩盖,从而使得此类检测方法的检测效果大大降低。第二类是基于帧间一致性的检测方法,此类方案主要是基于视频各帧之间的一致性进行检测,在原始人脸视频中,相邻帧之间应当存在一定的相关性,表情变化幅度很小,然而在伪造人脸视频中,由于各帧图像都是分别制作的,没有时间上的相关性,因此会出现表情突变的情况。目前这一方案的检测方法主要使用预训练好的卷积神经网络对视频各帧进行特征提取,对提取到的特征序列进行一致性分析,即采用递归神经网络进行训练,分析特征在时间上的相关性,从而对伪造视频进行检测。但是,这一方案在训练递归神经网络时极易造成网络不收敛等问题,计算成本高。
技术实现思路
专利技术目的:针对以上问题,本专利技术提出一种基于长短期记忆网络的换脸视频检测方法,通过该方法可以提高伪造人脸视频检测的精度,减少视频的分类检测时间。技术方案:为实现本专利技术的目的,本专利技术所采用的技术方案是:一种基于长短期记忆网络的换脸视频检测方法,包括如下步骤:(1)获取待检测的视频数据集,将数据集划分为训练集、验证集和测试集;(2)分别对划分后的各个数据集的视频数据提取关键帧及其后续帧,提取帧图像中的人脸图像,并对人脸图像进行增强处理;(3)使用卷积神经网络分别对各个数据集的人脸图像提取特征,并对提取的特征进行按序拼接,得到各个数据集的特征序列;(4)将特征序列作为长短期记忆网络的输入,该特征序列属于换脸视频的概率值作为网络输出,对网络进行训练,通过验证集测试分类精度,调整网络模型,直到分类精度满足预期,得到训练完成的网络模型;(5)将训练完成的网络模型作为分类器,将测试集的特征序列输入分类器中进行分类,得到分类结果即检测视频为换脸视频的概率。进一步地,在步骤(2)中,对视频数据进行帧提取并提取帧图像中的人脸图像,方法如下:(2.1)从视频数据中定位关键帧,并提取关键帧及其之后的K-1帧图像;(2.2)对提取到的各帧图像中的人脸进行定位和裁剪,得到人脸图像;(2.3)通过高通滤波器对人脸图像进行处理,得到增强后的图像。进一步地,在步骤(2.1)中,定位视频关键帧的方法如下:计算相邻帧之间的帧差欧式距离,K帧图像总共有K-2个帧差欧式距离;计算K-2个帧差欧式距离的极值,以及各极值点对应的帧差欧式距离值,计算各距离的均值;比较各极值点所对应帧差欧式距离值与均值的大小,取出大于均值的点,其对应的帧图像即为所要选的关键帧图像。进一步地,帧差欧式距离的计算公式如下:其中eulerdisdiff(i)为第i个帧差欧式距离,xi,xi+1,xi+2分别为第i、i+1、i+2帧图像的灰度值,K为提取的帧图像数目。进一步地,在步骤(2.2)中,对提取到的各帧图像中的人脸进行定位和裁剪,方法如下:加载Haar特征检测器,用于人脸检测;将当前的图像进行灰度化处理,简化图像的信息;将灰度化后的图像输入到Haar特征检测器进行人脸位置判断;根据得到的人脸位置信息对原始帧图像进行裁剪,得到人脸图像。进一步地,在步骤(2.3)中,通过高通滤波器对人脸图像进行处理的方法如下:对人脸图像的边界进行填充,得到与原图相同大小的人脸填充图像,以保证后续卷积操作能够得到与原图相同大小的图像;生成标准Laplacian掩膜,用于后续对图像的卷积操作;使用生成的Laplacian掩模对得到的人脸填充图像进行卷积操作,提取图像边缘;将步骤(2.2)得到的人脸图像与提取的图像边缘进行计算,得到处理后的人脸图像。进一步地,采用的标准Laplacian掩模为:进一步地,人脸图像和提取的图像边缘计算公式为:g(x,y)=f(x,y)+t(x,y)其中g(x,y)为增强后的人脸图像在(x,y)处的像素值,f(x,y)为输入的人脸图像在(x,y)处的像素值,t(x,y)表示提取到的图像边缘在(x,y)处的像素值。进一步地,在步骤(3)中,使用卷积神经网络对人脸图像进行特征提取,具体如下:所述卷积神经网络使用在ImageNet图像分类数据集中训练好的Xception网络模型;加载Xception网络模型,使Xception网络参数保持不变,由其输入层至最后一个全连接层构成特征提取模块;将步骤(2)得到的人脸图像输入到网络中进行特征提取,将网络最后一个全连接层的输出作为该帧图像的特征。进一步地,在步骤(4)中,使用长短期记忆网络进行训练的方法如下:(4.1)将步骤(3)中提取到的特征序列作为网络输入,网络输出为该特征序列来自换脸视频的概率值;根据得到的概率值与视频标签值计算神经网络的损失函数值;(4.2)计算损失函数关于网络权重和偏置的偏导数,然后使用梯度下降法更新网络权重和偏置,降低损失值,提高网络的分类效果;(4.3)每一轮训练结束后,使用验证集对网络模型进行测试,计算训练后的网络的分类精度;若分类精度不满足预期,调整网络模型的超参数,继续对网络进行训练,直至分类精度满足预期,得到训练完成的网络。有益效果:与现有技术相比,本专利技术的技术方案具有以下有益的技术效果:本专利技术利用帧差欧式距离对视频中的关键帧进行定位,能够提取视频中包含的有效信息,从而提高检测效果;本专利技术使用Haar特征对各帧图像进行人脸图像提取,能够排除视频中背景对分类器的干扰;本专利技术使用基于Laplacian算子的高通滤波器对提取的人脸图像进行处理,能够提取到人脸的细节信息,从而凸显伪造视频帧中的图像瑕疵;本专利技术使用预训练好的Xception网络模型对处理后的人脸图像进行特征提取,在节省特征提取器的训练成本的同时,保证了提取到的特征能够很好地表征输入的人脸图像;本专利技术使用长短期神经网络对特征序列进行分析,充分利用了伪造视频中存本文档来自技高网
...

【技术保护点】
1.一种基于长短期记忆网络的换脸视频检测方法,其特征在于:包括如下步骤:/n(1)获取待检测的视频数据集,将数据集划分为训练集、验证集和测试集;/n(2)分别对划分后的各个数据集的视频数据提取关键帧及其后续帧,提取帧图像中的人脸图像,并对人脸图像进行增强处理;/n(3)使用卷积神经网络分别对各个数据集的人脸图像提取特征,并对提取的特征进行按序拼接,得到各个数据集的特征序列;/n(4)将特征序列作为长短期记忆网络的输入,该特征序列属于换脸视频的概率值作为网络输出,对网络进行训练,通过验证集测试分类精度,调整网络模型,直到分类精度满足预期,得到训练完成的网络模型;/n(5)将训练完成的网络模型作为分类器,将测试集的特征序列输入分类器中进行分类,得到分类结果即检测视频为换脸视频的概率。/n

【技术特征摘要】
1.一种基于长短期记忆网络的换脸视频检测方法,其特征在于:包括如下步骤:
(1)获取待检测的视频数据集,将数据集划分为训练集、验证集和测试集;
(2)分别对划分后的各个数据集的视频数据提取关键帧及其后续帧,提取帧图像中的人脸图像,并对人脸图像进行增强处理;
(3)使用卷积神经网络分别对各个数据集的人脸图像提取特征,并对提取的特征进行按序拼接,得到各个数据集的特征序列;
(4)将特征序列作为长短期记忆网络的输入,该特征序列属于换脸视频的概率值作为网络输出,对网络进行训练,通过验证集测试分类精度,调整网络模型,直到分类精度满足预期,得到训练完成的网络模型;
(5)将训练完成的网络模型作为分类器,将测试集的特征序列输入分类器中进行分类,得到分类结果即检测视频为换脸视频的概率。


2.根据权利要求1所述的一种基于长短期记忆网络的换脸视频检测方法,其特征在于:在步骤(2)中,对视频数据进行帧提取并提取帧图像中的人脸图像,对人脸图像进行增强处理,方法如下:
(2.1)从视频数据中定位关键帧,并提取关键帧及其之后的K-1帧图像;
(2.2)对提取到的各帧图像中的人脸进行定位和裁剪,得到人脸图像;
(2.3)通过高通滤波器对人脸图像进行处理,得到增强后的图像。


3.根据权利要求2所述的一种基于长短期记忆网络的换脸视频检测方法,其特征在于:在步骤(2.1)中,定位视频关键帧的方法如下:
计算相邻帧之间的帧差欧式距离,K帧图像总共有K-2个帧差欧式距离;计算K-2个帧差欧式距离的极值,以及各极值点对应的帧差欧式距离值,计算各距离的均值;比较各极值点所对应帧差欧式距离值与均值的大小,取出大于均值的点,其对应的帧图像即为所要选的关键帧图像。


4.根据权利要求3所述的一种基于长短期记忆网络的换脸视频检测方法,其特征在于:帧差欧式距离的计算公式如下:



其中eulerdisdiff(i)为第i个帧差欧式距离,xi,xi+1,xi+2分别为第i、i+1、i+2帧图像的灰度值,K为提取的帧图像数目。


5.根据权利要求2所述的一种基于长短期记忆网络的换脸视频检测方法,其特征在于:在步骤(2.2)中,对提取到的各帧图像中的人脸进行定位和裁剪,方法如下:
加载Haar特征检测器;将当前的图像进行灰度化处理,将灰度化后的图像输入到Haar特征检测器进行人脸位置...

【专利技术属性】
技术研发人员:夏志华余佩鹏费建伟顾飞付章杰孙星明
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1