基于强化学习的黑盒视频对抗样本生成方法及评价方法技术

技术编号：35537780 阅读：36 留言：0更新日期：2022-11-09 15:04

本发明专利技术公开了一种基于强化学习的黑盒视频对抗样本生成方法，包括获取原始视频数据并分割得到视频块集合；对视频块集合插入位置信息得到带有位置信息的视频块集合；进行视觉特征提取得到视频块的特征；对带有位置信息的视频块集合进行提取得到关键视频块集合；对关键视频块集合进行迭代得到估计梯度；生成对抗样本值并构建对应的损失函数；将对抗样本值输入到目标视频模型中获取返回值，根据返回值和损失函数值得到最终构建的对抗样本。本发明专利技术还公开了一种包括所述基于强化学习的黑盒视频对抗样本生成方法的评价方法。本发明专利技术提高了添加的扰动的精准性，减少了对抗样本的复杂性，而且成本较低，可靠性高，效率较高。效率较高。效率较高。

全部详细技术资料下载

【技术实现步骤摘要】
基于强化学习的黑盒视频对抗样本生成方法及评价方法

[0001]本专利技术属于人工智能安全
，具体涉及一种基于强化学习的黑盒视频对抗样本生成方法及评价方法。

技术介绍

[0002]随着经济技术的发展和人们生活水平的提高，深度学习技术在许多基于视频数据的人工智能任务中有着广泛的应用，比如网络摄像机可以连接外部传感器，对监控的异常视频数据(例如偷盗、火灾)进行联动报警，从而预防可能发生的灾害等。因此，在诸多涉及安全的场景下，对深度学习技术进行充分的测试以保证其安全性和鲁棒性，就显得至关重要。
[0003]对抗样本是指一批经过加工处理的数据样本，其通过在原始数据的基础上添加一些微小的、难以察觉的对抗性扰动，从而使原神经网络模型产生错误的结果。因此，采用对抗样本对基于视频的深度学习技术进行测试，是现今非常重要的测试过程。
[0004]目前的对抗样本生成方法，一般是对视频的每一个视频帧进行梯度估计，并添加对抗性扰动。但是，由于连续的视频帧会引入额外的时间维度，因此对抗样本生成的过程需要大量的迭代请求来估算对抗性扰动...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的黑盒视频对抗样本生成方法，包括如下步骤：S1.获取原始视频数据；S2.对步骤S1获取的原始视频数据，采用滑动窗口进行分割，得到包括若干个视频块的视频块集合；S3.对步骤S2得到的视频块集合插入位置信息，得到带有位置信息的视频块集合；S4.对步骤S3得到的带有位置信息的视频块集合，采用自注意力机制进行视觉特征提取，得到各个视频块的特征；S5.根据步骤S4得到的各个视频块的特征，对带有位置信息的视频块集合进行提取，得到关键视频块集合；S6.对步骤S5得到的关键视频块集合进行迭代处理，从而得到估计梯度；S7.根据步骤S6得到的估计梯度，生成对抗样本值，并构建对应的损失函数；S8.将对抗样本值输入到目标视频模型中获取目标视频模型的返回值，并根据返回值和损失函数的值，得到最终构建的对抗样本。2.根据权利要求1所述的基于强化学习的黑盒视频对抗样本生成方法，其特征在于步骤S2所述的对步骤S1获取的原始视频数据，采用滑动窗口进行分割，得到包括若干个视频块的视频块集合，具体包括如下步骤：原始视频数据为V0，V0∈R
T
×
W
×
L
×
C
，其中R为实数域，T为视频数据的帧数，W为视频帧的宽，L为视频帧的长，C为视频帧的颜色通道数；采用采用滑动窗口M对原始视频数据V0进行分割，W
m
为滑动窗口的宽，L
m
为滑动窗口的长，H
m
为滑动窗口的高；滑动窗口M将原始视频数据V0切割成n个视频块，从而得到视频块集合V为V＝{v1,v2,...,v
n
}，其中3.根据权利要求2所述的基于强化学习的黑盒视频对抗样本生成方法，其特征在于步骤S3所述的对步骤S2得到的视频块集合插入位置信息，得到带有位置信息的视频块集合，具体包括如下步骤：将步骤S2得到的视频块集合V＝{v1,v2,...,v
n
}，输入到特征编码函数中，得到对应的视频块特征向量F为F＝{f1,f2,...,f
n
}；在每个视频块特征向量中，在视频块的特征向量F上注入位置信息；其中，注入的位置信息PI(p,i)为其中p为每个视频块的索引，i为位置信息编码向量中的第i个元素，d
model
为视频块特征向量的长度；将位置信息PI(p,i)与视频块特征向量F相加，得到带有位置信息的视频块集合F
*
为4.根据权利要求3所述的基于强化学习的黑盒视频对抗样本生成方法，其特征在于步骤S4所述的对步骤S3得到的带有位置信息的视频块集合，采用自注意力机制进行视觉特征提取，得到各个视频块的特征，具体包括如下步骤：将步骤S3得到的带有位置信息的视频块集合F
*
，输入到带有自注意力机制的视觉特征
提取器中，生成请求向量Q、关键向量K和值向量V；其中，生成请求向量Q的计算式为Q＝W
Q
·
F
*
，生成请求向量K的计算式为K＝W
K
·
F
*
，生成请求向量V的计算式为V＝W
F
·
F
*
；对每一个视频块通过查询Q、K、V矩阵可得到对应的Q
a
、K
a
和V
a
；将请求向量Q
a
与其他所有视频块的关键向量的转置K
T
进行点积运算，并采用softmax函数处理点积运算结果，得到自注意力权重W
a
为其中d
k
为视频块特征向量的维度；将自注意力权重W
a
与对应的视频块的值向量V
a
相乘，得到包含自注意力的向量Z
a
为Z
a
＝W
a
·
V
a
；包含自注意力的向量Z
a
就是视频块v
a
的特征。5.根据权利要求4所述的基于强化学习的黑盒视频对抗样本生成方法，其特征在于步骤S5所述的根据步骤S4得到的各个视频块的特征，对带有位置信息的视频块集合进行提取，得到关键视频块集合，具体包括如下步骤：将得到的各个视频块的特征Z
a
，通过输出维度为n维的全连接层进行降维，然后再将得到的n维向量输入到sigmoid函数，得到判别分数集合P为P＝{p1,p2,...,p
n
}，其中p
a
为第a个视频块的关键性分数；对判别分数集合P中的元素进行降序排序，并提取排序后的前m个元素所对应的视频块作为关键视频块集合V

【专利技术属性】
技术研发人员：胡超，余瑞实，施鹤远，湛誉，梁锴，刘荣凯，
申请(专利权)人：中南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人