当前位置: 首页 > 专利查询>复旦大学专利>正文

一种性能优化的对抗样本生成方法技术

技术编号:37969876 阅读:6 留言:0更新日期:2023-06-30 09:45
本发明专利技术提出了一种性能优化的对抗样本生成方法,包括以下步骤:S1,将所有的原始图片进行处理,处理后得到图片处理数据集;S2,将图片处理数据集中的图片进行噪声特征添加,生成噪声图片数据集;S3,若对抗样本与参考样本的对抗度大于或者等于预设对抗度,则将该对抗样本存放于对抗样本图片数据集中,并将该对抗样本从噪声图片数据集中删除;返回步骤S3;若对抗样本与参考样本的对抗度小于预设对抗度,则将该对抗样本从噪声图片数据集中删除,返回步骤S3。本发明专利技术能够实现对抗样本的生成,并将生成的对抗样本进行训练得到对抗模型。的对抗样本进行训练得到对抗模型。的对抗样本进行训练得到对抗模型。

【技术实现步骤摘要】
一种性能优化的对抗样本生成方法


[0001]本专利技术涉及一种大数据
,特别是涉及一种性能优化的对抗样本生成方法。

技术介绍

[0002]2014年10月Ian J.Goodfellow等人提出了一个通过对抗过程估计生成模型的新框架,即生成式对抗网络(GAN,Generative Adversarial Networks),其分为两个网络:G(Generator,发生器)和D(Discriminator,鉴别器)。具体地,G是一个生成网络,它可接收一个随机的噪声z,并通过这个噪声生成样本,记做G(z);D是一个判别网络,用于判别一个样本是不是“真实的”,其输入参数是x,x代表一个样本,输出的结果是D(x),代表样本x为真实图片的概率,如果D(x)为1,就代表该样本100%是真实的,如果D(x)为0,就代表该样本不可能是真实的。在训练过程中,生成网络G的目标是尽量生成真实的样本去欺骗判别网络D,而判别网络D的目标是尽量把生成网络G生成的样本和真实的样本分别开来,这样,生成网络G和判别网络D构成了一个动态的“博弈过程”。在最理想的状态下,最后博弈的结果是:生成网络G可以生成足以“以假乱真”的样本G(z),而对于判别网络D来说,它难以判定生成网络G生成的样本究竟是不是真实的,此时D(G(z))=0.5,由此可得到一个生成式的模型G,其可以用来生成以假乱真的样本。专利申请号2022111255070,名称为“一种对抗样本生成方法”,公开了能够批量产生对抗样本,同时绕过更多类型安全检测算法的扫描。具体地,本专利技术在实施过程中,在特征提取方面,依次获取数据样本的静态特征信息和动态特征信息后,对静态特征信息和动态特征信息中的特征项进行融合,得到特征向量,然后进行特征项筛选,得到筛选后特征向量,在此过程中,采用多特征项融合及筛选的方法,可便于形成更有效的特征向量,利于提升特征提取的精度。

技术实现思路

[0003]本专利技术旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种性能优化的对抗样本生成方法。
[0004]为了实现本专利技术的上述目的,本专利技术提供了一种性能优化的对抗样本生成方法,包括以下步骤:
[0005]S1,获取原始图片数据集,将所有的原始图片进行处理,处理后得到图片处理数据集;
[0006]S2,将图片处理数据集中的图片进行噪声特征添加,生成噪声图片数据集;
[0007]S3,从噪声图片数据集中选择任一张图片作为对抗样本,从图片处理数据集中选择生成对抗样本所对应的原图片,记作参考样本,判断对抗样本与参考样本的对抗度:
[0008]若对抗样本与参考样本的对抗度大于或者等于预设对抗度,则将该对抗样本存放于对抗样本图片数据集中,并将该对抗样本从噪声图片数据集中删除;返回步骤S3;
[0009]若对抗样本与参考样本的对抗度小于预设对抗度,则将该对抗样本从噪声图片数
据集中删除,返回步骤S3。
[0010]在本专利技术的一种优选实施方式中,在步骤S3之后还包括步骤S4,将对抗样本图片数据集中的对抗样本输入到训练模型中进行训练,获得对抗模型;
[0011]在本专利技术的一种优选实施方式中,在训练过程中包括利用损失函数确定迭代更新:
[0012][0013]m表示训练样本的总个数;
[0014]y
(i)
表示第i个样本的标签值;
[0015]h
θ
(x
(i)
)表示设定函数;
[0016]x
(i)
表示第i个样本的值;
[0017]若损失值J(θ)大于或者等于预设损失值阈值,则更新迭代;
[0018]若损失值J(θ)小于预设损失值阈值,则停止更新。
[0019]在本专利技术的一种优选实施方式中,在步骤S2中对图片处理数据集中的图片进行噪声特征添加的方法包括以下步骤:
[0020]S21,判断图片处理数据集中的图片是否存在彩色图片:
[0021]若图片处理数据集中的图片存在彩色图片,则将彩色图片转换为灰度图片I(x,y);则执行下一步;
[0022]若图片处理数据集中的图片不存在彩色图片,则执行下一步;
[0023]S22,对步骤S21中的灰度图像I(x,y)使用Haarcascad人脸识别算法,找出人脸所在区域;
[0024]S23,使用ESR关键点识别算法,找出人脸所在区域中人脸关键点位置I
n
(x,y),并找出表示左眼中心位置、右眼中心位置和嘴巴中心位置的三个关键点位置,分别记作为I1(x1,y1)、I2(x2,y2)和I3(x3,y3);
[0025]S24,根据三个关键点左眼中心位置、右眼中心位置和嘴巴中心位置I1(x1,y1)、I2(x2,y2)和I3(x3,y3)的相对位置,确定关键点的移动范围{u,v},其中u表示水平方向的移动范围,v表示垂直方向的移动范围;
[0026]S25,在移动范围{u,v}内生成三组移动数{Iz1(x1,y1),Iz2(x2,y2),Iz3(x3,y3)},基于此对关键点进行移动,移动后得到添加了噪声的关键点I
i

(x
i
,y
i
)=I
i
(x
i
,y
i
)+Iz
i
(x
i
,y
i
),i=1,2,3。
[0027]在本专利技术的一种优选实施方式中,在步骤S3中对抗样本与参考样本的对抗度的计算方法为:
[0028][0029]其中,为参考样本ζ对共同像素点集合I
ξ,ζ
的平均灰度值;
[0030]α为对抗样本ξ和参考样本ζ的调节参数,取值范围(0,1);
[0031]confr(ξ,ζ)为对抗样本ξ和参考样本ζ之间的对抗度;
[0032]R
ξ,k
为对抗样本ξ对共同像素点集合I
ξ,ζ
中像素点k的灰度值;
[0033]R
ζ,k
为参考样本ζ对像素点集合I
ξ,ζ
中像素点k的灰度值;
[0034]为对抗样本ξ对共同像素点集合I
ξ,ζ
的平均灰度值;
[0035]I
ξ,ζ
为对抗样本ξ和参考样本ζ共同像素点的集合。
[0036]在本专利技术的一种优选实施方式中,在步骤S1中对所有的原始图片进行处理得到图片处理数据集的方法包括以下步骤:
[0037]S11,统计原始图片数据集A中图片的总张数,记作a,a表示原始图片数据集中图片的总张数,分别为A1、A2、A3、
……
、A
a
,A1表示原始图片数据集中的第1图片,A2表示原始图片数据集中的第2图片,A3表示原始图片数据集中的第3图片,A
a
表示原始图片数据集中的第a图片;A={A1,A2,A本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种性能优化的对抗样本生成方法,其特征在于,包括以下步骤:S1,获取原始图片数据集,将所有的原始图片进行处理,处理后得到图片处理数据集;S2,将图片处理数据集中的图片进行噪声特征添加,生成噪声图片数据集;S3,从噪声图片数据集中选择任一张图片作为对抗样本,从图片处理数据集中选择生成对抗样本所对应的原图片,记作参考样本,判断对抗样本与参考样本的对抗度:若对抗样本与参考样本的对抗度大于或者等于预设对抗度,则将该对抗样本存放于对抗样本图片数据集中,并将该对抗样本从噪声图片数据集中删除;返回步骤S3;若对抗样本与参考样本的对抗度小于预设对抗度,则将该对抗样本从噪声图片数据集中删除,返回步骤S3。2.根据权利要求1所述的性能优化的对抗样本生成方法,其特征在于,在步骤S3之后还包括步骤S4,将对抗样本图片数据集中的对抗样本输入到训练模型中进行训练,获得对抗模型。3.根据权利要求1所述的性能优化的对抗样本生成方法,其特征在于,在步骤S1中对所有的原始图片进行处理得到图片处理数据集的方法包括以下步骤:S11,统计原始图片数据集A中图片的总张数,记作a,a表示原始图片数据集中图片的总张数,分别为A1、A2、A3、
……
、A
a
,A1表示原始图片数据集中的第1图片,A2表示原始图片数据集中的第2图片,A3表示原始图片数据集中的第3图片,A
a
表示原始图片数据集中的第a图片;A={A1,A2,A3,...,A
a
},A表示原始图片数据集;令图片序数a

=1;S12,判断原始图片数据集中的第a

图片A
a

的图片格式是否为预设图片格式,预设图片格式为bmp、jpg、png、tif、gif、apng、jpeg、jpf、jpc之一;若原始图片数据集中的第a

图片A
a

的图片格式为预设图片格式,则执行下一步;若原始图片数据集中的第a

图片A
a

的图片格式不为预设图片格式,则将原始图片数据集中的第a

图片A
a

的图片转换为预设图片格式,执行下一步;S13,判断原始图片数据集中的第a

图片A
a

的图片尺寸是否为预设图片尺寸,预设图片尺寸包括预设图片的宽度和预设图片的高度;若原始图片数据集中的第a

图片A
a

的图片尺寸为预设图片尺寸,则执行下一步;若原始图片数据集中的第a

图片A
a

的图片尺寸不为预设图片尺寸,则将原始图片数据集中的第a

图片A
a

的图片转换为预设图片尺寸,执行下一步;S14,判断a

与a间的关系:若a

>a,则执行下一步;若a

≤a,则a

=a

+1,返回步骤S12;S15,将转换后的a张图片存放在图片处理第一数据集中。4.根据权利要求1所述的性能优化的对抗样本生成方法,其特征在于,在步骤S13中将原始图片数据集中的第a

图片A
a

的图片转换为预设图片尺寸的方法包括以下步骤:S131,构建原始图片数据集中的第a

图片A
a

的像素点坐标系:以第a

图片A
a

的中心为二维坐标原点,以垂直于第a

图片A
a

的高为X轴,以垂直于第a

图片A
a

的宽为Y轴,形成第a

图片A
a

内的坐标系;S132,生成一个K
×
G的第a

画布,K表示预设图片的宽度,G表示预设图片的高度,构建第a

画布的像素点坐标系:以第a

画布的中心为二维坐标原点,以垂直于第a

画布的高为X
轴,以垂直于第a

画布的宽为Y轴,形成第a

画布内的坐标系;S133,令横向坐标点纵向坐标点S134,判断与K
a

间的关系:若且| |表示取绝对值,表示第a

图片横向坐标点比较值,值,表示原始图片数据集中的第a

图片A
a

横向像素点个数,K
a

表示第a

画布横向坐标点比较值,K
a

=K

a

/2,K

a

表示第a

画布横向像素点个数,则将所对应的RGB颜色值复制到所对应的RGB颜色值复制到表示原始图片数据集中的第a

图片A
a

的像素坐标点,表示第a

画布的像素坐标点;画布的像素坐标点;返回步骤S134;若或| |表示取绝对值,表示第a

图片横向坐标点比较值,图片横向坐标点比较值,表示原始图片数据集中的第a

图片A
a

横向像素点个数,K
a

表示第a

画布横向坐标点比较值,K
a

=K

a

/2,K

a

表示第a

画布横向像素点个数,则画布横向像素点个数,则执行下一步;S135,判断与G
a

间的关系:若且| |表示取绝对值,表示第a

图片纵向坐标点比较值,表示原始图片数据集中的第a

图片A
a

纵向像素点个数,G
a

表示第a

画布纵向坐标点比较值,G
a

=G

a

/2,G

a

表示第a

画布纵向像素点个数,则返回步骤S134;若或| |表示取绝对值,表示第a

图片纵向坐标点比较值,图片纵向坐标点比较值,表示原始图片数据集中的第a

图片A
a

纵向像素点个数,G
a

表示第a

画布纵向坐标点比较值,G
a

=G

a

/2,G

a

表示第a

画布纵向像素点个数,则画布纵向像素点个数,则执行下一步;S136,判断与K
a

间的关系:若且| |表示取绝对值,表示第a

图片横向坐标点比较值,值,表示原始图片数据集中的第a

图片A
a

横向像素点个数,K
a

表示第a

画布横向坐标点比较值,K
a

=K

a

/2,K

a

表示第a

画布横向像素点个数,则将
所对应的RGB颜色值复制到所对应的RGB颜色值复制到表示原始图片数据集中的第a

图片A
a

的像素坐标点,表示第a

画布的像素坐标点;画布的像素坐标点;返回步骤S136;若或| |表示取绝对值,表示第a

图片横向坐标点比较值,图片横向坐标点比较值,表示原始图片数据集中的第a

图片A
a

横向像素点个数,K
a

表示第a

画布横向坐标点比较值,K
a

=K

a

...

【专利技术属性】
技术研发人员:敖伟智
申请(专利权)人:复旦大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1