当前位置: 首页 > 专利查询>黄硕专利>正文

一种图像分类方法及系统技术方案

技术编号:35281892 阅读:23 留言:0更新日期:2022-10-22 12:24
本发明专利技术涉及机器视觉技术领域,尤其涉及一种图像分类方法及系统。所述方法包括:采集制作图像数据集,将数据集输入神经网络进行训练,所述神经网络包括输入,卷积、池化、全连接层、inception模块,dropout,softmax处理过程,得到神经网络图像识别分类模型,然后利用神经网络模型对未知的图像进行分类,并得到准确分类结果。本发明专利技术还涉及一种用于一种图像分类的系统,该系统包括:数据图像采集模块、服务器、神经网络训练模块、图像分类模块、结果输出模块。本发明专利技术的分类方法及系统,消除了现有技术存在的问题,减少了训练时间,提高了图像分类模型的应用能力和精度。模型的应用能力和精度。模型的应用能力和精度。

【技术实现步骤摘要】
一种图像分类方法及系统


[0001]本专利技术涉及机器视觉
,尤其涉及一种图像分类方法及系统。

技术介绍

[0002]利用机器视觉技术对图像进行识别和分类已经在很多领域得到了运用。比如利用机器视觉分析视频或者图像中的环境和物体,分辨出图像中的各种物体,比如动植物、交通工具、环境、颜色、图案、桥梁、厂房、车辆等等。
[0003]现有的图像分类技术,首先要用大量的已知样本对神经网络进行训练,以得到用于图像分类的神经网络模型,然后利用训练好的神经网络模型对图像进行分类。目前的神经网络在训练过程中常常会出现诸如过度拟合和梯度消失的问题,现有神经网络采用的参数过多,需要配备高性能的硬件设备,模型训练时间太长,同时,利用训练好的神经网络模型对图像进行分类耗时长,无法满足现场应用要求,导致图像分类应用受限。

技术实现思路

[0004]为了有效解决上述问题,本专利技术提出了一种新的图像分类方法及系统,有效解决现有技术存在的神经网络训练时间长、训练过程中出现的过度拟合、梯度消失等问题、以及模型精度低、图像分类耗时长等问题。
[0005]为实现上述目的,本专利技术采取的图像分类方法如图1所示:
[0006]采集图像,制作图像数据集,采集的图像类型应为2种或2种以上,每种类型的图像数量在5000

20000张之间,且每种类型的图像数量应当相等。每张图像像素可根据需要调整为 28*28,80*80,112*112,224*224等多种大小,这样就得到了图像数据集,
[0007]将图像数据集中的图像按照一定比例分为训练集和测试集,训练集和测试集均包含了与图像数据集相同的图像种类,且训练集和测试集中每种类型图像数量分别相等。训练集包含了图像数据集中图像总数的60%

90%,用于神经网络的训练,测试集包含了图像数据集中图像总数的40%

10%,用于测试得到的模型,当每种类型的图像数量较少时(比如)5000张时,训练集应占图像数据集的80%

90%,测试集则占图像数据集的10%

20%,当每种类型的图像数量较大时,比如20000张时,训练集占图像数据集的60%

80%,测试集占40%

20%;
[0008]利用训练集对本专利技术提出的神经网络(图2)进行训练,将数据集输入神经网络进行训练,所述神经网络包括输入、卷积、池化、inception模块、dropout、全连接层、softmax 处理过程,神经网络结构共包含17层,其中第一层为输入层,最后一层为输出层,中间为隐藏层,隐藏层共15层。
[0009]所述神经网络的训练步骤为:将训练样本输入,利用7
×
7滤波器,步长2进行卷积处理;采用3
×
3滤波器,步长2进行最大池化;采用3
×
3滤波器,步长1进行卷积处理;利用3
ꢀ×
3滤波器,步长2,进行最大池化处理;采用Inception模块处理,再次采用Inception模块处理;然后采用3
×
3滤波器,步长2,进行最大池化处理;然后进行Inception模块处理,再次
采用Inception模块处理;然后利用3
×
3滤波器,步长2,进行最大池化处理;然后进行Inception模块处理,再次采用Inception模块处理;采用7
×
7滤波器,步长1,进行平均池化处理,dropout层,全连接层,最后通过softmax处理,得到分类结果及模型的准确率。
[0010]神经网络结构(图2)中的Inception模块如图3所示,Inception模块由5个路径组成,其中,路径1由一个1
×
1滤波器组成,路径2由一个1
×
1滤波器和1个3
×
3滤波器组成,路径3由一个1
×
1滤波器和2个3
×
3滤波器组成,路径四由一个1
×
1滤波器组成,路径5不经过任何处理,该通道的输入不经过任何处理直接到达输出,与经过处理后达到输出的数据合并相加,这样能够有效防止梯度消失和梯度爆炸问题,快速达到所需的训练精度。 Inception模块的处理步骤为:
[0011]将前一层输出分别通过路径一的1
×
1滤波器、路径二的1
×
1滤波器+3
×
3滤波器、路径三的1
×
1滤波器+3
×
3滤波器+3
×
3滤波器进行处理;将上述三个路径处理的输出值进行合并;合并后的值输入路径四的1
×
1滤波器进行处理;将路径四的输出值与路径5的值合并后输出给下一层。
[0012]按照图2所示神经网络结构,从图像输入到得到分类结果及模型准确率计为1次训练(迭代次数),本专利技术中神经网络训练的迭代次数为:20000

30000,迭代次数小于10000时,学习率为0.0001,迭代次数大于10000小于30000时,学习率为0.00001。操作环境:WINDOWS 10操作系统,使用Python3.6(Anaconda)作为编程语言,在tensorflow环境中,通过Pycharm 平台运行。
[0013]按照图2所示步骤进行训练,当完成全部迭代次数,模型训练结束,完成训练得到图像识别分类模型。
[0014]输入测试集,利用训练神经网络得到的神经网络模型对测试集中的图像进行分类,验证神经网络模型的准确率。
[0015]利用神经网络模型对未知的图像进行识别和分类,完成图像分类工作。
[0016]一种用于一种图像分类的系统,该系统包括:数据图像采集模块、服务器、神经网络训练模块、图像分类模块,结果输出模块。其中:
[0017]数据图像采集模块利用各种软件如matlab,网络爬虫等对网络上的图像进行采集,也可以USB、无线等方式与摄像头,录像机、手机、照相机、视频监控系统连接获得所需要的图像。数据图像采集模块与存储服务器连接,将采集到的图像传输到服务器。
[0018]服务器分别与数据图像采集模块、神经网络训练模块、图像分类模块、结果输出模块连接,用于存储及传输图像采集模块采集到的待分类的图像、训练用的图像数据集,以及训练后得到的图像分类模型及以及分类的图像结果。
[0019]神经网络训练模块:神经网络训练模块与服务器连接,从服务器调用用于训练的图像数据集,神经网络训练模块还设有USB接口,可通过移动硬盘或者U盘获得用于训练的图像数据集,神经网络训练模块对神经网络进行训练,并最终得到可以实际应用的模型。
[0020]图像识别模块:图像识别模块与神经网络训练模块、服务器、图像采集模块连接,从服务器或者神经网络模块调取训练得到的模型,从服务器或者图像采集模块调取需要分类的模型,并对图像进行正确分类,确定本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像分类方法,其特征是,包括如下步骤:步骤1:采集图像,制作图像数据集,图像类型为2种或2种以上,每种类型的图像应采集5000至20000张,每张图像像素可根据需要调整为28*28,80*80,112*112,224*224等大小;步骤2:将图像数据集中的图像按照一定比例分为训练集和测试集,训练集用于神经网络的训练,测试集用于神经网络模型的精确度测;步骤3:将训练集输入神经网络,对神经网络进行训练;步骤4:完成预定的神经网络训练次数,得到神经网络分类模型;步骤5:输入测试集,利用训练神经网络得到的神经网络模型对测试集中的图像进行分类,得到神经网络模型的准确率;步骤6:利用训练神经网络得到的神经网络模型,将需要进行分类的未知图像输入到模型,模型对未知的图像进行分类,完成图像分类工作;步骤7:将分类结果输送到服务器保存,并输送到结果输出模块,通过屏幕显示,打印机打印等方式输出。2.如权利要求1所述的一种图像分类方法,其试训练集和测试集均包含了与图像数据集相同的图像种类,且训练集和测试集中每种类型图像数量各自分别相等。当每种类型的图像数量为5000

10000张,训练集应按图像数据集的80%

90%划分,当每种类型的图像数量为10001

20000张,训练集应按图像数据集的60%

80%划分,其余为测试集。3.如权利要求所述的一种图像分类方法,其神经网络包括输入、卷积、池化、inception模块、dropout、全连接层、softmax处理过程,所述神经网络包含一个输入层,一个输出层(即softmax),中间隐藏层为15层,其神经网络一次迭代训练的步骤为:首先利用7
×
7滤波器,取步长为2,对图像进行处理,处理后的输出作为下一个处理过程的输入,以此类推;采用3
×
3滤波器,步长为2进行最大池化处理;采用3
×
3滤波器,步长为1进行卷积处理;利用3
×
3滤波器,步长为2,进行最大池化处理;采用Inception模块处理;采用Inception模块处理;采用3
×
3滤波器,步长为2,进行最大池化处理;进行Inception模块处理;采用Inception模块处理;利用3
×
3滤波器,步长为2,进行最大池化处理;进行Inception模块处理;采用Inception模块处理;采用7
×
7滤波器,步长为1,进行平均池化处理;进行dropout处理;全连接层展开;通过softmax处理,完成一次迭代训练。4.如权利要求1所述的一种图像分类方法,其神经网络结构中Inception模块的处理步骤为:
将前一层输出分别通过路径一的1
×
1滤波器、路径二的1
×
1滤波器+3
×
3滤波器、路径三的1
×

【专利技术属性】
技术研发人员:黄硕
申请(专利权)人:黄硕
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1