当前位置: 首页 > 专利查询>广州大学专利>正文

基于ResNet和LSTM的多维时空特征融合深度伪造视频检测方法及装置制造方法及图纸

技术编号:44130129 阅读:55 留言:0更新日期:2025-01-24 22:49
本发明专利技术公开了一种基于ResNet和LSTM的多维时空特征融合深度伪造视频检测方法及装置,包括:获取视频中的人脸图像,并定位人脸图像中的关键点;基于预训练的ResNet模型提取人脸图像中的空间特征向量;基于注意力机制对ResNet模型提取的空间特征向量进行特征增强;将从每一帧人脸图像中提取的增强后的空间特征向量按时间顺序输入到LSTM网络中,得到时间序列特征;将LSTM输出的时间序列特征与ResNet模型提取的空间特征进行融合,得到融合特征向量,将融合后的特征向量输入到全连接层进行分类,将分类结果输入到SoftMax层计算每个类别的概率,得到伪造和真实视频的分类概率。本发明专利技术通过多维时空特征的融合,有效检测深度伪造视频中的人脸伪造内容,提升检测的准确性和鲁棒性。

【技术实现步骤摘要】

本专利技术属于机器学习的,具体涉及一种基于resnet和lstm的多维时空特征融合深度伪造视频检测方法及装置。


技术介绍

1、近年来,随着深度学习领域的飞速进步,生成对抗网络(gan)等先进算法在创造高度真实的合成内容方面取得了显著成就,尤其体现在深度伪造(deepfake)技术上,该技术能够高度仿真地模拟和重建人脸表情、动作乃至语音,使合成视频在视觉效果上几乎与真实视频无异。这种技术的滥用已经成为一个严重的社会问题,因为它被用于散播虚假信息、引发政治风波及侵犯个人隐私,进而对公共安全构成了严峻挑战。

2、目前针对深度伪造的人脸识别检测技术主要分为三类:基于图像特征的方法、基于时间序列信息的方法以及多模态融合方法。基于图像特征的技术通常依赖于卷积神经网络(cnn)来提取静态图像中的空间特征,并通过分析面部细节如纹理、光照和形态来辨识伪造的迹象。基于时间序列信息的技术则采用递归神经网络(rnn)或长短期记忆网络(lstm)来分析视频帧间的动态关系,检测非自然的表情变化或时间上的不连贯性。而多模态融合方法则是综合利用视觉和听觉等多种信息源,以增强检本文档来自技高网...

【技术保护点】

1.基于ResNet和LSTM的多维时空特征融合深度伪造视频检测方法,其特征在于,包括下述步骤:

2.根据权利要求1所述基于ResNet和LSTM的多维时空特征融合深度伪造视频检测方法,其特征在于,所述获取视频中的人脸图像,并定位人脸图像中的关键点,具体为:

3.根据权利要求1所述基于ResNet和LSTM的多维时空特征融合深度伪造视频检测方法,其特征在于,所述基于预训练的ResNet模型提取人脸图像中的空间特征向量,具体为:

4.根据权利要求1所述基于ResNet和LSTM的多维时空特征融合深度伪造视频检测方法,其特征在于,所述基于注意力机制对Res...

【技术特征摘要】

1.基于resnet和lstm的多维时空特征融合深度伪造视频检测方法,其特征在于,包括下述步骤:

2.根据权利要求1所述基于resnet和lstm的多维时空特征融合深度伪造视频检测方法,其特征在于,所述获取视频中的人脸图像,并定位人脸图像中的关键点,具体为:

3.根据权利要求1所述基于resnet和lstm的多维时空特征融合深度伪造视频检测方法,其特征在于,所述基于预训练的resnet模型提取人脸图像中的空间特征向量,具体为:

4.根据权利要求1所述基于resnet和lstm的多维时空特征融合深度伪造视频检测方法,其特征在于,所述基于注意力机制对resnet模型提取的空间特征向量进行特征增强,具体为:

5.根据权利要求1所述基于resnet和lstm的多维时空特征融合深度伪造视频检测方法,其特征在于,所述lstm网络包括:

6.根据权利要求1所述基于resnet和lstm的多维时空...

【专利技术属性】
技术研发人员:李树栋冯依林吴晓波方滨兴张欣姚明俊曲春屹罗文伟
申请(专利权)人:广州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1