The invention is applicable to the field of computer technology, and provides a method and terminal for identifying confrontational images. The method includes: input the target image to be detected into a preset image classification model for processing, obtain the target feature information of the target image and the target classification result corresponding to the target image; and process the target image, the target feature information and the target classification result. The target classification result is imported into the preset KNN classifier, and the confidence score of the target classification result is determined based on the training set of the sample image to the target image, the target characteristic information and the target classification result. When the confidence score is less than or equal to the preset confidence score threshold, the target image is judged to be an antagonistic image. The embodiment of the present invention identifies whether the target image belongs to the antagonistic image based on the confidence score of the target image classification result, avoids the interference of the antagonistic image to the classification result and improves the classification accuracy.
【技术实现步骤摘要】
一种识别对抗性图像的方法及终端
本专利技术属于计算机
,尤其涉及一种识别对抗性图像的方法及终端。
技术介绍
图像分类通常根据提取出的图像特征(如图像颜色、形状、纹理等视觉特征)来判断出图像属于预设类别中的哪一类,比如风景、人物、餐厅,礼堂等。随着对图像分类精度要求越来越高,目前通常采用机器学习技术对图像进行分类。深度学习往往需要成千上万的样本图像训练图像分类模型,由于训练数据越好,训练效果越好,图像分类模型的分类精度越高,为了保证深度学习的效果以及确保图像分类模型能准确地进行分类,样本图像需要采用符合特定标准的图像。然而,当样本图像或待检测的图像为恶意修改的对抗性图像时,对抗性图像会对基于机器学习的深度网神经络进行攻击,目前因无法识别对抗性图像,从而导致图像分类模型输出的分类结果为具有高置信度的错误分类,降低了分类结果的准确度。
技术实现思路
有鉴于此,本专利技术实施例提供了一种识别对抗性图像的方法及终端,以解决现有技术中,因无法识别对抗性图像,从而导致图像分类模型输出的分类结果为具有高置信度的错误分类,降低了分类结果的准确度的问题。本专利技术实施例的第一方面提 ...
【技术保护点】
1.一种识别对抗性图像的方法,其特征在于,包括:将待检测的目标图像输入预设的图像分类模型进行处理,得到所述目标图像的目标特征信息以及所述目标图像对应的目标分类结果;其中,所述图像分类模型是通过使用机器学习算法对样本图像训练集进行训练得到,在训练过程中,所述图像分类模型的输入为所述样本图像训练集的图像信息,所述图像分类模型的输出为所述图像样本对应的分类结果;所述样本图像训练集包含的样本图像符合预设的训练要求;将所述目标图像、所述目标特征信息以及所述目标分类结果导入预设的KNN分类器,基于所述样本图像训练集对所述目标图像、所述目标特征信息以及所述目标分类结果,确定所述目标分类结 ...
【技术特征摘要】
1.一种识别对抗性图像的方法,其特征在于,包括:将待检测的目标图像输入预设的图像分类模型进行处理,得到所述目标图像的目标特征信息以及所述目标图像对应的目标分类结果;其中,所述图像分类模型是通过使用机器学习算法对样本图像训练集进行训练得到,在训练过程中,所述图像分类模型的输入为所述样本图像训练集的图像信息,所述图像分类模型的输出为所述图像样本对应的分类结果;所述样本图像训练集包含的样本图像符合预设的训练要求;将所述目标图像、所述目标特征信息以及所述目标分类结果导入预设的KNN分类器,基于所述样本图像训练集对所述目标图像、所述目标特征信息以及所述目标分类结果,确定所述目标分类结果的置信度分数;当所述置信度分数小于或等于预设的置信度分数阈值时,判定所述目标图像为对抗性图像。2.根据权利要求1所述的方法,其特征在于,所述将所述目标图像、所述目标特征信息以及所述目标分类结果导入预设的KNN分类器,基于所述样本图像训练集对所述目标图像、所述目标特征信息以及所述目标分类结果,确定所述目标分类结果的置信度分数,包括:将所述目标图像、所述目标特征信息以及所述目标分类结果导入预设的KNN分类器,计算所述样本图像训练集中每个样本图像与所述目标图像之间的距离值;基于所述距离值确定所述目标图像的至少两个最邻近图像;基于每个所述最邻近图像的分类标签以及所述目标图像的目标分类结果,确定所述目标分类结果的置信度分数。3.根据权利要求2所述的方法,其特征在于,所述基于每个所述最邻近图像的分类标签以及所述目标图像的目标分类结果,确定所述目标分类结果的置信度分数,包括:基于每个所述最邻近图像的分类标签以及所述目标图像的目标分类结果,采用预设的公式计算所述目标分类结果的置信度分数;所述预设的公式为:s(q,c)为置信度分数;c为所述目标分类结果,q为所述最邻近图像,ci为所述样本图像训练集中第i个样本图像的分类标签,i的取值为1到k,k为正整数;wi为所述最邻近图像对应的置信度权重;1{ci=c}为基于所述最邻近图像的分类标签与所述目标分类结果确定的值,当所述最邻近图像的分类标签与所述目标分类结果一致时,则1{ci=c}取值为1;当所述最邻近图像的分类标签与所述目标分类结果不一致时,则1{ci=c}取值为0。4.根据权利要求3所述的方法,其特征在于,所述基于所述最邻近图像的分类标签以及所述目标图像的目标分类结果,采用预设的公式计算所述目标分类结果的置信度分数之前,还包括:确定每个所述最邻近图像对应的置信度权重。5.根据权...
【专利技术属性】
技术研发人员:赵峰,王健宗,肖京,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。