一种多模态深度学习模型脆弱性的分析方法和系统技术方案

技术编号：34104747 阅读：8 留言：0更新日期：2022-07-12 00:13

本发明专利技术提出了一种多模态深度学习模型脆弱性的分析方法和系统，属于对抗攻击和模型鲁棒性分析领域。该方法通过生成一系列白盒的对抗样本来测试目标模型的鲁棒性，主要步骤包括：首先获取目标多模态深度学习模型及其使用的训练数据集；分别提取数据集中的视觉模态特征、文本模态特征、音频模态特征；使用提取到的数据集特征分别训练单模态本地模型；通过测试单模态本地模型的训练效果得到不同模态的对抗样本生成权重；迭代生成对抗样本：视觉模态和音频模态使用基于PGD的梯度下降方法生成扰动，自然语言文本模态使用梯度近似优化的近义词替换方法生成扰动；通过生成的一系列多模态对抗样本检验模型的攻击成功率，得到目标模型的脆弱性分析结果。的脆弱性分析结果。的脆弱性分析结果。

全部详细技术资料下载

【技术实现步骤摘要】
一种多模态深度学习模型脆弱性的分析方法和系统

[0001]本专利技术涉及对抗攻击和模型鲁棒性分析领域，尤其涉及一种多模态深度学习模型脆弱性的分析方法和系统。

技术介绍

[0002]随着近年来深度学习相关技术的不断发展以及其在学术界和工业界的应用场景不断增多，针对多个模态数据同时进行分析的需求开始涌现，促进了多模态机器学习的发展。多模态机器学习主要用于寻找多个模态之间的关联以及同时利用多个模态的信息进行决策，最为常见的是自然语言模态，声音信号模态以及视觉信号模态等。近十年，多模态机器学习已经全面进入了深度学习时代，在多媒体文件处理、情感分析和推荐系统等任务和场景中得到广泛的应用。同时，针对神经网络鲁棒性的分析相关研究显示，任何现有的网络模型，包括多模态深度学习模型都有可能被欺骗。对抗攻击通过在输入数据上施加不易察觉的扰动等方式可以有效影响模型的输出，从而达成攻击者的攻击目标。目前在计算机视觉以及自然语言处理等领域，这一攻击模式都得到了较为充分的研究。在图片模态中，现有的研究成果可以实现在输入图片上施加噪声，使图片分类模型做出错误的决策；而在文本模态中，通过在文本中单词和字符级别的插入及替换操作，可以诱导自然语言翻译模型或者问答系统输出错误的结果。在现实任务场景中，这一攻击允许攻击者在社交媒体上绕过审核系统发布恶意言论，或者使用现实对抗样本干扰自动驾驶系统的正常运行等。这种对抗攻击不仅反映了深度学习模型的脆弱性，也一定程度上阻碍了人工智能的应用和发展。
[0003]虽然现有的针对各个单个模态的攻击方法已经日趋成熟

【技术保护点】

【技术特征摘要】
1.一种多模态深度学习模型脆弱性的分析方法，其特征在于，包含以下步骤：(1)获取目标模型M及其视觉、音频和文本三种模态的训练数据集；(2)对多模态数据集分别进行预处理和特征提取，得到视觉模态特征、声学模态特征和文本模态特征；(3)根据步骤(2)得到的视觉模态特征、声学模态特征和文本模态特征，分别训练得到对应的单模态本地模型，并根据单模态本地模型的学习效果确定不同模态下的对抗样本生成权重；(4)根据各个模态的对抗样本生成权重以及目标模型损失函数相对于各个模态输入的梯度信息，生成一系列不同模态下的对抗样本；(5)测试对抗样本的攻击成功率，得到目标模型的脆弱性分析结果。2.根据权利要求1所述的多模态深度学习模型脆弱性的分析方法，其特征在于，所述的步骤(2)包括：针对视觉模态数据集，首先从视频中抽取关键帧，调整至统一大小，再通过预训练模型抽取视觉特征；针对文本模态数据集，首先将文本进行分词操作，并将分词后得到的token序列转换为词向量，通过预训练的BERT模型提取词向量特征，作为文本模态特征。针对音频模态数据集，首先经过去噪处理后通过分帧和加窗操作获取一系列含有稳定音频信号的帧信号，再分别通过快速傅里叶变换和常数Q变换，将帧信号从时域转换到频域，提取帧信号的MFCC特征和CQCC特征，拼接后作为声学模态特征。3.根据权利要求2所述的多模态深度学习模型脆弱性的分析方法，其特征在于，若视觉模态数据集中的主要内容为人物，则抽取关键帧并调整至统一大小后，使用人脸识别系统进行人脸捕捉，裁剪得到人脸图像，将面部标志点、面部动作单元及面部朝向特征作为视觉模态特征；若视觉模态数据集中的主要内容并非人物，则抽取关键帧并调整至统一大小后，直接采用ResNet预训练模型抽取视觉模态特征。4.根据权利要求2所述的多模态深度学习模型脆弱性的分析方法，其特征在于，声学模态特征的获取方法为：预处理：对音频数据进行预加重处理，并将处理后的音频进行分帧、加窗，得到预处理后的音频数据；分支处理：对预处理后的音频数据进行快速傅里叶变换，对快速傅里叶变换后的数据进行滤波和对数功率操作；在快速傅里叶变换的同时，对预处理后的音频数据进行常数Q变换，对常数Q变换后的数据进行对数功率操作并均匀重采样；将分支处理后得到的两种频域信号的功率信号进行离散余弦变换，分别得到MFCC特征和CQCC特征，拼接后作为声学模态特征。5.根据权利要求1所述的多模态深度学习模型脆弱性的分析方法，其特征在于，所述的步骤(3)包括：(3
‑
1)对步骤(2)得到的视觉模态特征、声学模态特征和文本模态特征划分训练集、验证集和测试集，根据不同模态下的训练集、验证集训练对应模态下的本地模型，记为视觉模态本地模型C
V
、音频模态本地模型C
A
、文本模态本地模型C
T
；(3
‑
2)在测试集上分别测试C
V
,C
A
,C
T
的准确率；
(3
‑
3)...

【专利技术属性】
技术研发人员：纪守领，李泽宇，张旭鸿，陈建海，
申请(专利权)人：尚蝉浙江科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人