一种基于卷积神经网络模型的危险物品图像分类方法技术

技术编号:14799726 阅读:63 留言:0更新日期:2017-03-14 21:50
一种基于卷积神经网络模型的危险物品图像分类方法。其包括在图形处理器上搭建基于包含多种卷积神经网络模型的Caffe深度学习框架的平台;准备训练数据集和带有标签的测试数据集,并利用上述数据集在图形处理器上训练上述卷积神经网络模型;列出中国民航中危险物品类别;将危险物品类别中的原始图像和旋转180度后的图像输入上述已训练好的卷积神经网络模型,得到top-5测试结果,实现含有危险物品图像的分类。本发明专利技术方法具有智能性强,方法简单,分类准确,检测速度快等优点,适用于对含有民航危险物品图像的自动分类。

【技术实现步骤摘要】

本专利技术属于图像分类
,特别是涉及一种基于卷积神经网络模型的危险物品图像分类方法
技术介绍
人工神经网络是一种用于尝试模拟人脑的功能而产生的人工智能方法,在上个世纪末期经历了一段时间的蓬勃发展之后再次陷入低潮。深度学习技术是受到生物学和神经学领域在动物和人脑视觉神经领域的新发现的启发,模拟视觉系统的层次化的工作模式,在人工神经网络的基础上构建具有层次化结构的深度网络模型,给人工神经网络带来了新的发展方向。卷积神经网络是将人工神经网络和深度学习技术结合而产生的一种新型人工神经网络,是目前人工神经网络领域的研究热点,其与传统方法相比,在图像分类领域具有很好的应用效果。之前卷积神经网络之所以没有得到长远发展是因为硬件计算能力有限,可供训练的数据也有限,如今随着硬件计算性能的稳步提高,各种图像数据急速增长,这些都为其发展奠定了基础。训练卷积神经网络需要大的数据集,比如ImageNet。现在的卷积神经网络可以充分利用海量数据自动学习到大量图像的特征信息。ImageNet中含有很多种图像的类别,其中一些是民航中危险物品的类别,因此,可以利用卷积神经网络来进行民航危险物品图像的检测。此外,由于卷积方法在图像处理领域本质上是使图像变得平滑,因此,像素的平移对分类结果的影响较小,而图像的旋转对分类的结果影响较大。因此,对于卷积神经网络不能识别的图像,将其旋转后再进行分类,有可能得到正确的分类结果,从而可提高图像分类的准确率,但目前尚未发现有效的方法。
技术实现思路
为了解决上述问题,本专利技术的目的在于提供一种分类准确率高,分类速度快的基于卷积神经网络模型的危险物品图像分类方法。为了达到上述目的,本专利技术提供的基于卷积神经网络模型的危险物品图像分类方法包括按顺序进行的下列步骤:1)在图形处理器上搭建基于包含多种卷积神经网络模型的Caffe深度学习框架的平台;2)准备训练数据集和带有标签的测试数据集,并利用上述数据集在图形处理器上训练上述卷积神经网络模型;3)列出中国民航中危险物品类别;4)将上述危险物品类别中的原始图像和旋转180度后的图像输入上述已训练好的卷积神经网络模型,得到top-5测试结果,实现含有危险物品图像的分类。在步骤2)中,所述的训练数据集是由从ImageNet数据集中选择的0.12亿张训练图像组成;测试数据集采用带有标签的确认数据集;卷积神经网络模型采用CaffeNet、VGG和GoogleNet。本专利技术提供的基于卷积神经网络模型的危险物品图像分类方法具有的优点和积极效果是:(1)本专利技术采用了现在人工智能中图像分类最好的深度学习方法,分类准确率高;(2)综合考虑了原始图像和旋转后图像的分类效果,进一步提高了分类准确率;(3)采用海量的训练样本来训练深度卷积神经网络模型,使模型具有高智能性;(4)基于图形处理器计算,训练和测试速度比基于CPU的计算有大幅度的提高。附图说明图1为基于深层卷积神经网络的图像分类方法对比(a)只考虑原始图像;(b)考虑旋转180度后的图像;图2为经过CaffeNet模型,旋转前不能识别而旋转后可以识别的图像示例;图3为使用四种卷积神经网络,考虑图像旋转的top_5准确率对比曲线。(a)CaffeNet;(b)VGG16;(c)VGG19;(d)GoogleNet。图4为Top-k对于准确率的影响曲线。(a)类别413;(b)类别763。具体实施方式下面结合附图和具体实施例对本专利技术提供的基于卷积神经网络模型的危险物品图像分类方法进行详细说明。本专利技术提供的基于深层卷积神经网络的图像分类方法包括按顺序进行的下列步骤:1)在图形处理器上搭建基于包含多种卷积神经网络模型的Caffe深度学习框架的平台;Caffe是目前流行的高效深度学习框架之一,具有纯粹的C++/CUDA架构,支持命令行、Python和MATLAB接口,可以在CPU和图形处理器上直接无缝切换。Caffe的优势是:1、上手快。其包含的模型与相应优化都是以文本形式而非源码形式给出,并且给出了模型的定义、最优化设置以及预训练的权重,因此方便立即上手。2、速度快。能够运行最深层的模型和海量的数据,比如:Caffe与cuDNN结合使用,测试CaffeNet时,在K40上处理每张图像只需要1.17ms。3、模块化。方便扩展到新的任务和设置上,可以使用Caffe提供的各层类型来定义自己的模型。4、开放性。公开代码和参考模型,方便用户复现和再开发。Caffe的安装与配置:Caffe需要预先安装一些依赖项。首先是CUDA驱动。不论是CentOS还是Ubuntu都预装了开源的nouveau显卡驱动,如果不禁用,则CUDA驱动不能正确安装。安装了CUDA之后,依次按照Caffe官网安装指南安装BLAS、OpenCV、Boost即可(Caffe官网安装指南网址是http://caffe.berkeleyvision.org/installation.html)。2)准备训练数据集和带有标签的测试数据集,并利用上述数据集在图形处理器上训练上述卷积神经网络模型;本专利技术采用的是ImageNet数据集。ImageNet数据集中有超过1.5亿张具有标签的高分辨率图像,这些图像划分为22000类,均来自互联网,由一些志愿者进行标注。从2010年开始,每年都举办全球范围的基于ImageNet数据集的大规模视觉识别竞赛(ImageNetLarge-ScaleVisualRecognitionChallenge,ILSVRC)。ILSVRC采用ImageNet的一个子数据集,具有1000个类别,每个类别中大概有1000幅左右的图像。总体上,有大概0.12亿张训练图像,50000张确认图像(带标注,每个类别50张图像),150000张测试图像(不带标注,每个类别150张图像)。ImageNet数据集由可变分辨率图像组成,但是系统需要一个不变的输入维度。因此,本专利技术降采样图像到固定的256*256分辨率。在这里本专利技术从ImageNet数据集中选择0.12亿张训练图像作为训练数据集,测试数据集采用带有标签的确认数据集。本专利技术使用3种最流行的卷积神经网络模型,分别是CaffeNet,VGG和GoogleNet。CaffeNet是ILSVRC2012竞赛的冠军,是卷积神经网络在图像分类上的经典模型,由5个组的卷积和3层全连接(2层全连接图像特征,1层全连接分类特征)组成。VGG和GoogleNet是ILSVR本文档来自技高网
...

【技术保护点】
一种基于卷积神经网络模型的危险物品图像分类方法,其特征在于:其包括按顺序进行的下列步骤:1)在图形处理器上搭建基于包含多种卷积神经网络模型的Caffe深度学习框架的平台;2)准备训练数据集和带有标签的测试数据集,并利用上述数据集在图形处理器上训练上述卷积神经网络模型;3)列出中国民航中危险物品类别;4)将上述危险物品类别中的原始图像和旋转180度后的图像输入上述已训练好的卷积神经网络模型,得到top‑5测试结果,实现含有危险物品图像的分类。

【技术特征摘要】
1.一种基于卷积神经网络模型的危险物品图像分类方法,其特征在于:其包括按顺序
进行的下列步骤:
1)在图形处理器上搭建基于包含多种卷积神经网络模型的Caffe深度学习框架的平
台;
2)准备训练数据集和带有标签的测试数据集,并利用上述数据集在图形处理器上训练
上述卷积神经网络模型;
3)列出中国民航中危险物品类别;
4)将上述危险物品类别中的原始图像和旋转180度后的...

【专利技术属性】
技术研发人员:屈景怡吴仁彪朱威李佳怡
申请(专利权)人:中国民航大学
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1