【技术实现步骤摘要】
用于保护图像样本集的隐私信息的方法和装置
[0001]本说明书实施例涉及人工智能领域,尤其涉及一种用于保护图像样本集的隐私信息的方法和装置。
技术介绍
[0002]随着计算机软件和人工智能的不断发展,机器学习模型的应用也越来越广泛,例如,机器学习模型被广泛地应用于图像处理领域,而训练一个性能良好的用于处理图像的模型需要使用大量的图像样本。现阶段,网络上很多开源的图像样本集都是开放的。也有很多企业或者个人的图像样本集由于涉及隐私或机密,只允许内部使用。图像样本集,尤其是人脸图像样本集,可能包含大量的用户隐私信息,当数据被泄露或者开源时,其含有的隐私信息可能会被攻击者恶意使用。例如,攻击者可以针对泄露的人脸图像与标签的对应关系进行关联性攻击,比如,通过AI(Artificial Intelligence,人工智能)换脸生成人脸图像对应的虚假视频,以对该人脸图像对应的用户的亲属实行诈骗,极大的威胁了用户隐私。这类攻击的产生主要是因为攻击者成功获取到了人脸图像与标签的对应关系。基于此,如何对图像样本集进行保护,具有重要的现实意义和价 ...
【技术保护点】
【技术特征摘要】
1.一种用于保护图像样本集的隐私信息的方法,包括:将待保护图像样本集中的待保护图像样本确定为目标样本,其中,所述目标样本包括目标图像和目标标签;确定标签与所述目标标签不同的图像作为被选择图像;以预训练的图像识别模型针对所述被选择图像的处理结果趋近于针对所述目标图像的处理结果为目标,调整所述被选择图像的像素值,得到调整图像,其中,所述图像识别模型使用所述待保护图像样本集训练得到;将所述目标标签设置为所述调整图像的标签,得到包括所述调整图像和所述目标标签的受保护图像样本,用于形成受保护图像样本集。2.根据权利要求1所述的方法,其中,所述确定标签与所述目标标签不同的图像作为被选择图像,包括:从所述待保护图像样本集中选取标签与所述目标标签不同的图像作为被选择图像。3.根据权利要求1所述的方法,其中,在调整所述被选择图像的像素值之前,所述方法还包括:响应于确定所述受保护图像样本集对应的目标用户所使用的模型结构已知,使用所述待保护图像样本集,基于所述模型结构进行模型训练,得到所述图像识别模型。4.根据权利要求3所述的方法,其中,所述处理结果为,所述图像识别模型的中间层的输出向量;所述调整所述被选择图像的像素值,得到调整图像,包括:确定针对所述被选择图像的第一输出向量和针对所述目标图像的第二输出向量之间的距离;以最小化所述距离为目标,调整所述被选择图像的像素值。5.根据权利要求4所述的方法,其中,所述距离包括以下之一:欧式距离,曼哈顿距离,差值向量的无穷阶范数。6.根据权利要求4所述的方法,其中,所述以最小化所述距离为目标,调整所述被选择图像的像素值,包括:确定所述距离相对于所述像素值的梯度;以预定步长,沿梯度下降的方向,执行预定步数的像素值调整。7.根据权利要求1所述的方法,其中,在调整所述被选择图像的像素值之前,所述方法还包括:响应于确定所述受保护图像样本集对应的目标用户所使用的模型结构未知,使用所述待保护图像样本集,基于多个预设的预定模型结构分别进行模型训练,得到多个图像识别模型。8.根据权利要求7所述的方法,其中,所述处理结果为,所述多个图像识别模型的中间层的输出向量;所述调整所述被选择图像的像素值,得到调整图像,包括:确定所述多个图像识别模型分别针对所述被选择图像的输出向量和针对所述目标图像的输出向量之间距离的加权结果;以最小化所述加权结果为目标,调整所述被选择图像的像素值。9.根据权利要求1所述的方法,其中,所述方法还包括:针对所述目标图像确定多张被选择图像,生成多张调整图像;
将所述多张调整图像的标签均设置为目标标签,得到多个受保护图像样本。10.根据权利要求4或8所述的方法,其中,图像识别模型包括softmax层,以及所述中间层为所述softmax层的前一层。11.一种用于保护图像样本集的隐私信息的装置,包括:第一确定单元,配置为将待保护图像样本集中的待保护图像样本确定为目标样本,其中,所述目标样本包括目标图像和目标标签;第二确定单元,配置为确定标签与所述...
【专利技术属性】
技术研发人员:李一鸣,刘沛东,邱伟峰,江勇,夏树涛,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。