The invention discloses a novel depth convolution neural network method for classifying noisy images, which is characterized by adopting a new pooling method of random maximum pooling. Random maximum pooling method randomly chooses the first n larger values in the range of receptive field as the pooling result. First, all the values in the range of receptive field are sorted and the first n larger values are selected. Then, one of the first n larger values is randomly selected as the pooling result. The random maximum pooling method combines the characteristics of the maximum pooling method and the random pooling method. It can not only retain the main characteristic information in the receptive field, but also improve the network's suppression of the noise in the receptive field. The method is validated on CIFAR 10, SVHN and MINIST data sets and achieves good results.
【技术实现步骤摘要】
一种随机最大池化深度卷积神经网络噪声图形分类方法
本专利技术属于计算机视觉
,涉及到针对噪声图像的分类方法,具体为一种基于随机最大值池化的深度卷积神经网络噪声图像分类方法。
技术介绍
在计算机视觉领域,图像分类是一项非常重要的研究内容,被广泛应用在人脸识别,汽车自动驾驶等场合。图像分类问题关键的是特征提取,特征提取的好坏直接影响分类精度。传统的图像分类是通过人工设计特征[1-4],如HOG-特征、LBP特征和SIFT特征等来实现。随着科学技术的发展,数据集规模增大,且应用场景不断变化,人工设计特征的过程较为复杂,泛化能力较差,无法满足实时性要求和鲁棒性。2006年以来,深度学习迅速发展[5-7],在图像分类问题中取得巨大成功。其中,深度卷积神经网络模型应用最为广泛,通过自上而下的非线性数据抽象,来获得用于分类的特征信息,避免了传统人工特征复杂的设计过程。在深度卷积神经网络中,卷积和池化操作操作是提取特征的主要方式。为了获得更好的网络分类性能,研究人员针对卷积核和池化层提出多种改进策略。针对传统卷积核尺寸固定的问题,谷歌团队提出GoogleNet[8],网络使用Bottleneck结构,对网络每一层特征图利用不同尺寸的卷积核进行特征提取,获得了不同尺度的特征信息;为了在参数数量增加较少的情况下获取更加全局性的特征信息,Fisher[9]等人提出空洞卷积,通过分散卷积点,使得卷积点之间存在空洞,增加了卷积核的视野范围;为了能够增加网络的泛化能力,Zeiler[10]于2013年提出随机池化的概念,通过引入概率值,赋予所有节点被选择的可能性。上述方法的改进 ...
【技术保护点】
1.一种基于随机最大值池化的深度卷积神经网络噪声图像分类方法,其特征在于针对噪声图像分类,首先对其进行预处理,然后通过基于随机最大值池化的深度卷积神经网络进行模型训练,利用训练好的深度卷积神经网络模型进行噪声图像分类,包括以下步骤:1)将数据集分成训练集和测试集。2)对训练集和数据集进行数据预处理:2.1)为了提升网络的检测速度,达到实时性要求,将数据集中所有图片尺寸变换成32×32;2.2)对训练集和数据集进行对比度归一化处理,归一化的目的是能够使图像具有仿射不变性,并加快网络收敛的速度;2.3)对训练集和数据集进行白化处理,去除数据之间的相关性,并具有相同的方差,降低输入的冗余性。3)采用基于随机最大值池化的深度卷积神经网络进行训练和检测:3.1)在大量实验的基础上,确定网络结构及网络参数,包括卷积层数,特征图的数量和激活函数等;3.2)利用训练集进行网络训练。为了解决噪声图片中高频信息对网络提取特征过程的干扰,采用随机最大值池化方法进行深度卷积神经网络训练;3.3)利用训练出来的网络模型对测试集进行测试,确定网络性能。4)将训练好的网络模型作为含噪声图像分类工具。
【技术特征摘要】
1.一种基于随机最大值池化的深度卷积神经网络噪声图像分类方法,其特征在于针对噪声图像分类,首先对其进行预处理,然后通过基于随机最大值池化的深度卷积神经网络进行模型训练,利用训练好的深度卷积神经网络模型进行噪声图像分类,包括以下步骤:1)将数据集分成训练集和测试集。2)对训练集和数据集进行数据预处理:2.1)为了提升网络的检测速度,达到实时性要求,将数据集中所有图片尺寸变换成32×32;2.2)对训练集和数据集进行对比度归一化处理,归一化的目的是能够使图像具有仿射不变性,并加快网络收敛的速...
【专利技术属性】
技术研发人员:芮挺,费建超,杨成松,唐建,刘建青,芮思琦,齐奕,李华兵,田辉,刘好全,刘华丽,邵发明,
申请(专利权)人:中国人民解放军陆军工程大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。