【技术实现步骤摘要】
一种基于多分辨率的图像分类方法
本专利技术属于图像处理领域,尤其涉及到一种基于多分辨率的图像分类方法。
技术介绍
图像的分类作为计算机视觉领域的重要组成部分,能够有效地对图像的内容进行分析,获取图像中的关键信息,并给出正确的判断。图像分类看似是最简单的问题,却又是一个核心问题,其重要性还体现在其它的一些计算机视觉问题,如物体定位和识别、图像内容分割等,对现实的工作生活及社会的发展具有重要的意义。图像分类关注于全局统计信息,而且对于图像数据,深度学习具有优秀的建模和特征提取能力,已被广泛应用于图像物体分类的理论分析和实际应用。Kong提出基于深度置信网络构建模型,利用方向梯度直方图(HistogramofOrientedGradient,HOG)算子和特征很好地区分了真实交通场景图像数据中的行人、车辆等,并且模型在光照、姿势、分辨率上都具有非常好的鲁棒性。BoYu等通过引入多任务训练机制来提升深度模型性能,明显改善了人脸分类识别效果。SunY等基于CNN设计出一个DeepID人脸识别系统在人脸识别挑战带标签的数据库LFW(LabeledFacesintheWild) ...
【技术保护点】
一种基于多分辨率的图像分类方法,其特征在于:步骤1:数据集准备,数据集含N种类别,每类含M种分辨
【技术特征摘要】
1.一种基于多分辨率的图像分类方法,其特征在于:步骤1:数据集准备,数据集含N种类别,每类含M种分辨其中W为图片的宽,H为图片的高,M=0,1,2,...n,每种分辨率的图片数量相近,将图片分成训练集和测试集两个部分;步骤2:制作图片标签,标签表示为l(l∈(1,N)),表示属于第几类,在训练集中,同一类别的图片标签保持一致,不同类别的标签不能相同;步骤3:构建图片数据库,在深度卷积神经网络训练时需要输入训练数据,利用准备好的数据集和标签将图片数据转换为lmdb格式,所述lmdb为内存映射数据库,读取的效率更高,而且支持不同程序同时读取;步骤4:针对多分辨率输入设计了两种网络结构,确定深度神经网络输入层节点数、输出层节点数、隐藏层数和隐藏层节点数,随机初始化各层的连接权值W和偏置b,给定学习速率η,选定激活函数RELU,选定损失函数Loss,所述激活函数的作用是能够给神经网络加入一些非线性因素,使得神经网络可以更好地解决较为复杂的问题,RELU的数学表达式为:步骤5:训练深度神经网络直到神经网络输出层误差达到精度要求或训练次数达到最大迭代次数,结束训练,保存网络结构和参数,得到训练好的神经网络模型;步骤6:输入任意一张测试图片到训练好的神经网络模型中,神经网络的输出即为该图片的类别。2.根据权利要求1的基于多分辨率的图像分类方法,其特征在于:所述步骤4中,第一种深度神经网络结构,采用跳过部分池化层的方法,所述池化层在卷积层后面,通过池化层来降低卷积层输出的特征向量,本发明结构一中跳过池化层的个数取决于输入图片的分辨率大小和最小分辨率的图片大小;跳过的个数为:在特征图大小统一前,不同分辨率图片共同作用卷积层和激活层,单独作用池化层,在特征图大小统一后共...
【专利技术属性】
技术研发人员:章东平,倪佩青,胡葵,杨力,张香伟,
申请(专利权)人:中国计量大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。