【技术实现步骤摘要】
一种用于图像处理的神经网络以及相关设备
本申请涉及人工智能领域,尤其涉及一种用于图像处理的神经网络以及相关设备。
技术介绍
人工智能(ArtificialIntelligence,AI)是利用计算机或者计算机控制的机器模拟、延伸和扩展人的智能。人工智能包括研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。目前,基于深度学习的神经网络进行图像处理是人工智能常见的一种应用方式。尽管如今的神经网络已经具备极高的识别准确率,但研究者发现,在对输入的原始图像进行极其微小的扰动之后,就可以迷惑识别准确度很高的神经网络,使其识别准确率急剧下降,这种被扰动的图像,我们称之为对抗(adversarial)图像。为了提高神经网络的鲁棒性,人们提出了对抗训练,也即将对抗图像和与对抗图像对应的正确标签加入训练数据集中对神经网络进行训练,从而提高了神经网络对对抗图像的鲁棒性,鲁棒性指的是神经网络对对抗图像仍能够准确识别。但研究发现,随着神经网络处理对抗图像的鲁棒性的提高,神经网络处理原始图像的识别准确率不 ...
【技术保护点】
1.一种神经网络的训练方法,其特征在于,所述方法包括:/n将对抗图像分别输入第一特征提取网络和第二特征提取网络,得到所述第一特征提取网络生成的第一鲁棒表示和所述第二特征提取网络生成的第一非鲁棒表示,其中,所述对抗图像为对原始图像进行过扰动处理的图像,鲁棒表示指的是对扰动不敏感的特征,非鲁棒表示指的是对扰动敏感的特征;/n将所述第一鲁棒表示输入分类网络,得到分类网络输出的第一分类类别,将所述第一非鲁棒表示输入分类网络,得到分类网络输出的第二分类类别;/n根据第一损失函数,对所述第一特征提取网络和所述第二特征提取网络进行迭代训练,直至满足收敛条件,输出训练后的第一特征提取网络和 ...
【技术特征摘要】
1.一种神经网络的训练方法,其特征在于,所述方法包括:
将对抗图像分别输入第一特征提取网络和第二特征提取网络,得到所述第一特征提取网络生成的第一鲁棒表示和所述第二特征提取网络生成的第一非鲁棒表示,其中,所述对抗图像为对原始图像进行过扰动处理的图像,鲁棒表示指的是对扰动不敏感的特征,非鲁棒表示指的是对扰动敏感的特征;
将所述第一鲁棒表示输入分类网络,得到分类网络输出的第一分类类别,将所述第一非鲁棒表示输入分类网络,得到分类网络输出的第二分类类别;
根据第一损失函数,对所述第一特征提取网络和所述第二特征提取网络进行迭代训练,直至满足收敛条件,输出训练后的第一特征提取网络和训练后的第二特征提取网络;
其中,所述第一损失函数用于表示所述第一分类类别和第一标注类别之间的相似度,且用于表示所述第二分类类别和第二标注类别之间的相似度,所述第一标注类别为与所述对抗图像对应的正确类别,所述第二标注类别为与所述对抗图像对应的错误类别。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述原始图像分别输入所述第一特征提取网络和所述第二特征提取网络,得到所述第一特征提取网络生成的第二鲁棒表示和所述第二特征提取网络生成的第二非鲁棒表示;
将所述第二鲁棒表示和所述第二非鲁棒表示组合,得到组合后的第一表示;
将组合后的第一表示输入分类网络,以通过分类网络根据所述组合后的第一表示执行分类操作,得到分类网络输出的第三分类类别;
所述根据第一损失函数,对所述第一特征提取网络和所述第二特征提取网络进行迭代训练,直至满足收敛条件,包括:
根据所述第一损失函数和第二损失函数,对所述第一特征提取网络和所述第二特征提取网络进行迭代训练,直至满足收敛条件,其中,所述第二损失函数用于表示所述第三分类类别与第三标注类别之间的相似度,所述第三标注类别为与所述原始图像对应的正确类别。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述原始图像输入所述第一特征提取网络,得到所述第一特征提取网络生成的第二鲁棒表示;
将所述第二鲁棒表示输入分类网络,以通过分类网络根据所述第二鲁棒表示执行分类操作,得到分类网络输出的第四分类类别;
所述根据第一损失函数,对所述第一特征提取网络和所述第二特征提取网络进行迭代训练,直至满足收敛条件,包括:
根据所述第一损失函数和第三损失函数,对所述第一特征提取网络和所述第二特征提取网络进行迭代训练,直至满足收敛条件,其中,所述第三损失函数用于表示所述第四分类类别与第三标注类别之间的相似度,所述第三标注类别为与所述原始图像对应的正确类别。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述原始图像输入所述第二特征提取网络,得到所述第二特征提取网络生成的第二非鲁棒表示;
将所述第二非鲁棒表示输入分类网络,以通过分类网络根据所述第二非鲁棒表示执行分类操作,得到分类网络输出的第五分类类别;
所述根据第一损失函数,对所述第一特征提取网络和所述第二特征提取网络进行迭代训练,直至满足收敛条件,包括:
根据所述第一损失函数和第四损失函数,对所述第一特征提取网络和所述第二特征提取网络进行迭代训练,直至满足收敛条件,其中,所述第四损失函数用于表示所述第五分类类别与第三标注类别之间的相似度,所述第三标注类别为与所述原始图像对应的正确类别。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述原始图像分别输入所述第一特征提取网络和所述第二特征提取网络,得到所述第一特征提取网络生成的第二鲁棒表示和所述第二特征提取网络生成的第二非鲁棒表示;
将所述第二鲁棒表示和所述第二鲁棒表示组合,得到组合后的第一表示,将组合后的第一表示输入分类网络,以通过分类网络根据所述组合后的第一表示执行分类操作,得到分类网络输出的第三分类类别;
将所述第二鲁棒表示输入分类网络,以通过分类网络根据所述第二鲁棒表示执行分类操作,得到分类网络输出的第四分类类别;
将所述第二非鲁棒表示输入分类网络,以通过分类网络根据所述第二非鲁棒表示执行分类操作,得到分类网络输出的第五分类类别;
所述根据第一损失函数,对所述第一特征提取网络和所述第二特征提取网络进行迭代训练,直至满足收敛条件,包括:
根据所述第一损失函数和第五损失函数,对所述第一特征提取网络和所述第二特征提取网络进行迭代训练,直至满足收敛条件,其中,所述第五损失函数用于表示所述第四分类类别与第三标注类别之间的相似度,且用于表示所述第五分类类别与所述第三标注类别之间的相似度,且用于表示所述第六分类类别与所述第三标注类别之间的相似度,所述第三标注类别为与所述原始图像对应的正确类别。
6.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据所述第二损失函数的函数值,生成第一梯度;
根据所述第一梯度对所述原始图像进行扰动处理,以生成所述对抗图像,将所述第三标注类别确定为所述第一标注类别。
7.根据权利要求3所述的方法,其特征在于,所述方法还包括:
根据所述第三损失函数的函数值,生成第二梯度;
根据所述第二梯度对所述原始图像进行扰动处理,以生成所述对抗图像,将所述第三标注类别确定为所述第一标注类别。
8.根据权利要求4所述的方法,其特征在于,所述方法还包括:
根据所述第四损失函数的函数值,生成第三梯度;
根据所述第三梯度对所述原始图像进行扰动处理,以生成所述对抗图像,将所述第三标注类别确定为所述第一标注类别。
9.根据权利要求1至8任一项所述的方法,其特征在于,所述方法还包括:
将所述第一鲁棒表示和所述第一非鲁棒表示组合,得到组合后的第二表示;
将所述组合后的第二表示输入分类网络,得到分类网络输出的第六分类类别;
所述将所述第一鲁棒表示输入分类网络,得到分类网络输出的第一分类类别,将所述第一非鲁棒表示输入分类网络,得到分类网络输出的第二分类类别,包括:
在所述第六分类类别与所述第一标注类别不同的情况下,将所述第一鲁棒表示输入分类网络,得到分类网络输出的第一分类类别,将所述第一非鲁棒表示输入分类网络,得到分类网络输出的第二分类类别。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
在所述第六分类类别与所述第一标注类别不同的情况下,将所述第六分类类别确定为所述第二标注类别。
11.根据权利要求1至8任一项所述的方法,其特征在于,所述第一特征提取网络为卷积神经网络或者残差神经网络,所述第二特征提取网络为卷积神经网络或残差神经网络。
12.一种图像处理网络,其特征在于,所述图像处理网络包括第一特征提取网络、第二特征提取网络和特征处理网络;
所述第一特征提取网络,用于接收输入的第一图像,生成与所述第一图像对应的鲁棒表示,所述鲁棒表示指的是对扰动不敏感的特征;
所述第二特征提取网络,用于接收输入的所述第一图像,生成与所述第一图像对应的非鲁棒表示,所述非鲁棒表示指的是对扰动敏感的特征;
所述特征处理网络,用于获取所述鲁棒表示和所述非鲁棒表示,以输出与所述第一图像对应的第一处理结果。
13.根据权利要求12所述的网络,其特征在于,所述特征处理网络,具体用于:
将所述鲁棒表示和所述非鲁棒表示组合,根据组合后的表示,输出与所述第一图像对应的第一处理结果;或者
根据所述鲁棒表示,输出与所述第一图像对应的第一处理结果;或者
根据所述非鲁棒表示,输出与所述第一图像对应的第一处理结果。
14.根据权利要求12或13所述的网络,其特征在于,所述特征处理网络,具体用于:
根据组合后的表示执行分类操作,输出与所述第一图像对应的分类类别;或者,
根据所述鲁棒表示执行分类操作,输出与所述第一图像对应的分类类别;或者,
根据所述非鲁棒表示执行分类操作,输出与所述第一图像对应的分类类别。
15.根据权利要求12所述的网络,其特征在于,所述第一处理结果指示所述第一图像为原始图像,或者,所述第一处理结果指示所述第一图像为扰动后的图像。
16.根据权利要求15所述的网络,其特征在于,所述特征处理网络,具体用于:
根据所述鲁棒表示,确定与所述第一图像对应的第一分类类别;
根据所述非鲁棒表示,确定与所述第一图像对应的第二分类类别;
在所述第一分类类别与所述第二分类类别一致的情况下,输出的第一处理结果指示所述第一图像为原始图像;
在所述第一分类类别与所述第二分类类别不一致的情况下,输出的第一处理结果指示所述第一图像为扰动后的图像。
17.根据权利要求12所述的网络,其特征在于,所述特征处理网络,具体用于:
将所述鲁棒表示和所述非鲁棒表示组合,并根据组合后的表示执行检测操作,以输出与所述第一图像对应的检测结果,所述第一处理结果包括所述检测结果。
18.根据权利要求12或13所述的网络,其特征在于,
所述图像处理网络为以下中的一项或多项:图像分类网络、图像识别网络、图像分割网络或图像检测网络。
19.根据权利要求12至13任一项所述的网络,其特征在于,所述特征处理网络包括感知机。
20.根据权利要求12至13任一项所述的网络,其特征在于,所述第一特征提取网络为卷积神经网络或残差神经网络,所述第二特征提取网络为卷积神经网络或残差神经网络。
21.一种神经网络的训练装置,其特征在于,所述装置包括:
输入模块,用于将对抗图像分别输入第一特征提取网络和第二特征提取网络,得到所述第一特征提取网络生成的第一鲁棒表示和所述第二特征提取网络生成的第一非鲁棒表示,其中,所述对抗图像为对原始图像进行过扰动处理的图像,鲁棒表示指的是对扰动不敏感的特征,非鲁棒表示指的是对扰动敏感的特征;
所述输入模块,还用于将所述第一鲁棒表示输入分类网络,得到分类网络输出的第一分类类别,将所述第一非鲁棒表示输入分类网络,得到分类网络输出的第二分类类别;
训练模块...
【专利技术属性】
技术研发人员:王一飞,刘扶芮,李震国,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。