基于卷积神经网络的机动车、驾驶人档案图像识别方法技术

技术编号:20486534 阅读:23 留言:0更新日期:2019-03-02 19:38
本发明专利技术公开了一种基于卷积神经网络的机动车、驾驶人档案图像识别方法;本发明专利技术利用真实的机动车、驾驶人档案图像数据,具有数据量大、类别众多等特点,由此根据机动车、驾驶人档案图像训练出来的卷积神经网络识别准确率高。本发明专利技术实现了自动识别、分类机动车、驾驶人档案图像,且具有执行速度快、准确性高、高效率等特点。避免了大量的人为识别、分类工作。

【技术实现步骤摘要】
基于卷积神经网络的机动车、驾驶人档案图像识别方法
本专利技术属于深度学习
,具体涉及到一种基于卷积神经网络的机动车、驾驶人档案图像识别方法。
技术介绍
随着经济和社会的发展,互联网的普及率越来越高,每时每刻在互联网上都有大量的图像资源在产生、传送、接收。图像资源包含着大量对经济、社会有益的信息,在数量如此众多的图像资源下,人工识别会消耗大量的人工和费用,所以利用计算机来完成图像识别任务就显得尤为重要。随着“互联网+”的提出,各个领域大量的图像资源都会上传到网络上。随着城市人口逐渐增加,汽车保有量的飞速增长,机动车、驾驶人档案图像的数据量也在飞速增长。机动车、驾驶人档案图像类别众多,并且由于大量历史数据的存在,同一类别的图像也存在样式区别巨大等的特点,由于这些原因,根据以往的经验,通过人工识别、上传图像时,难免出现分类错误等现象,而且存在大量未分类的历史数据,如果由人工逐一核实比对重新分类,将耗费大量的人工,并且很难保证重新分类过程中不出现再次分类错误。如何能够通过深度学习的技术手段,对机动车、驾驶人档案图像进行自动识别、分类,将会大大降低人工的费用和时间。
技术实现思路
本专利技术针对现有技术的不足,提供了一种基于卷积神经网络的机动车、驾驶人档案图像识别方法。本专利技术中所谓的机动车、驾驶人档案图像是指包含档案资料目录、机动车驾驶证申请表、身体条件证明、身份证复印件、科目一成绩单、驾驶证、行驶证、购置税、合格证、汽车图片等100余种,涵盖机动车和驾驶人业务的档案图像(参考《业务资料影像化分类代码》)。本专利技术技术方案的主要构思:根据海量的机动车、驾驶人档案图像数据,在对图像数据进行预处理后,搭建并训练一个卷积神经网络,并利用训练好的模型完成对机动车、驾驶人档案图像的识别、分类工作。本专利技术方法包括以下步骤:步骤(1)、准备足够的机动车、驾驶人档案图像,同一类别的档案图像放置在同一文件夹中;步骤(2)、将机动车、驾驶人档案图像按设定比例自动分成训练集、测试集;步骤(3)、将训练集、测试集数据分别转换成TF-Record形式,在此过程中统一图像大小,并对图像进行标准化处理;步骤(4)、选择合适的超参数,搭建一个卷积神经网络;步骤(5)、将训练集的TF-Record数据作为输入,选择合适的迭代次数,训练搭建好的卷积神经网络;步骤(6)、将测试集的TF-Record数据作为输入,通过训练好的卷积神经网络得到对应的测试集准确率;步骤(7)、判断测试集准确率是否达到预期标准,如果未达到预期标准,则重复步骤(4),(5),(6)数次,直到测试集准确率达到预期标准为止;步骤(8).使用训练好的卷积神经网络模型制成机动车、驾驶人档案图像识别器和分类器,能够完成单张识别和多张分类的功能。本专利技术具有的有益效果:本专利技术利用真实的机动车、驾驶人档案图像数据,具有数据量大、类别众多等特点,由此根据机动车、驾驶人档案图像训练出来的卷积神经网络识别准确率高。本专利技术实现了自动识别、分类机动车、驾驶人档案图像,且具有执行速度快、准确性高、高效率等特点。避免了大量的人为识别、分类工作。附图说明图1是机动车、驾驶人档案图像识别的流程图。具体实施方式以下结合附图对本专利技术作进一步说明。如图1所示,本专利技术包括如下步骤:步骤(1).数据准备:按照机动车、驾驶人档案图像的类别进行收集数据,每个类别收集足够的数据,并放置在同一文件夹下,文件夹按照类名来命名。步骤(2).数据分割:根据预先设定好的比率ratio,将机动车、驾驶人档案图像数据集分成训练集和测试集,每个类别进行数据分割时都按照比率ratio进行分割。步骤(3).数据预处理:将训练集、测试集中的图像统一转换为指定的大小:width*height*3,其中,width是图片的宽度,height是图片的高度。然后将统一大小的图片像素值张量x及其标签转化为卷积神经网络可以识别的输入数据格式(TF-Record),并根据公式(1)对所有图像进行标准化。其中xnow为经标准化处理后图片RGB三通道的像素值,x为原本图片RGB三通道的像素值,mean分别为三通道像素值的均值,stddev为三通道像素的标准差,num_elements为三通道各自的像素个数。步骤(4).搭建卷积神经网络。根据输入的图像特征,选择合适的超参数搭建卷积神经网络。其中神经网络的激活函数都选择线性整流函数(RectifiedLinearUnit,ReLU)。网络中偏置biases的初始值为0.1,前五层权值weights使用了Xavier初始化方法,后三层权值weights初始值满足期望为0,标准差为0.005的正态分布。步骤(5).训练网络。使用交叉熵来表示损失函数,并使用了系数为0.0005的L2正则化惩罚项,损失函数见公式(2)。使用随机梯度下降法来优化损失函数,最终batch大小为50,学习率为0.0005,迭代次数为20000。其中m为样本数量,y_为样本的标签,即对应的真实值,y为神经网络的预测输出值,w为神经网络的参数。步骤(6).计算网络准确率。使用测试集的图片数据(已经转化成TF-Record格式),将其输入到训练好的神经网络中,此时的神经网络Dropout层不起作用,损失函数去除L2正则化的惩罚项,根据测试集中每个样本预测值和真实值是否一致来统计准确率。步骤(7).调试网络。包括调整网络结构、调整参数等。根据步骤(6)中的准确率,判断网络是否到达预期标准,(这个预期标准需要根据实际情况设定,范围为0-1之间。比如0表示全部错误,1表示全部准确,0.98表示98%准确)如果没有到达到预期标准,则不断重复步骤(4)、(5)、(6),调整网络的结构和超参数,直到准确率达到预期标准。步骤(8).制作识别器。利用训练好的网络模型来完成机动车、驾驶人档案图像识别的工作,当有单张图像输入时,将其输入到网络,输出网络预测其属于的类别;当有多张未分类的图像输入时,将它们输入到网络,根据网络输出的预测结果,将它们自动分到所在的类别中。本文档来自技高网...

【技术保护点】
1.基于卷积神经网络的机动车、驾驶人档案图像识别方法,其特征在于,该方法具体包括以下步骤:步骤(1)、准备足够的机动车、驾驶人档案图像,同一类别的档案图像放置在同一文件夹中;步骤(2)、将机动车、驾驶人档案图像按设定比例自动分成训练集、测试集;步骤(3)、将训练集、测试集数据分别转换成TF‑Record形式,在此过程中统一图像大小,并对图像进行标准化处理;步骤(4)、选择合适的超参数,搭建一个卷积神经网络;步骤(5)、将训练集的TF‑Record数据作为输入,选择合适的迭代次数,训练搭建好的卷积神经网络;步骤(6)、将测试集的TF‑Record数据作为输入,通过训练好的卷积神经网络得到对应的测试集准确率;步骤(7)、判断测试集准确率是否达到预期标准,如果未达到预期标准,则重复步骤(4),(5),(6)数次,直到测试集准确率达到预期标准为止;步骤(8).使用训练好的卷积神经网络模型制成机动车、驾驶人档案图像识别器和分类器,能够完成单张识别和多张分类的功能。

【技术特征摘要】
1.基于卷积神经网络的机动车、驾驶人档案图像识别方法,其特征在于,该方法具体包括以下步骤:步骤(1)、准备足够的机动车、驾驶人档案图像,同一类别的档案图像放置在同一文件夹中;步骤(2)、将机动车、驾驶人档案图像按设定比例自动分成训练集、测试集;步骤(3)、将训练集、测试集数据分别转换成TF-Record形式,在此过程中统一图像大小,并对图像进行标准化处理;步骤(4)、选择合适的超参数,搭建一个卷积神经网络;步骤(5)、将训练集的TF-Record数据作为输入,选择合适的迭代次数,训练搭建好的卷积神经网络;步骤(6)、将测试集的TF-Record数据作为输入,通过训练好的卷积神经网络得到对应的测试集准确率;步骤(7)、判断测试集准确率是否达到预期标准,如果未达到预期标准,则重复步骤(4),(5),(6)数次,直到测试集准确率达到预期标准为止;步骤(8).使用训练好的卷积神经网络模型制成机动车、驾驶人档案图像识别器和分类器,能够完成单张识别和多张分类的功能。2.根据权利要求1所述的基于卷积神经网络的机动车、驾驶人档案图像识别方法,其特征在于:步骤(3)具体为:将训练集、测试集中的图像统一转换为指定的大小:width*height*3,其中,width是图片的宽度,height是图...

【专利技术属性】
技术研发人员:黄冬发陈教王天然李万清
申请(专利权)人:杭州诚道科技股份有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1