【技术实现步骤摘要】
一种基于海量单类单幅图像的图像分类网络训练方法
本专利技术涉及计算机视觉、模式识别,机器学习等
,特别是一种基于单类单幅图像的图像分类网络训练方法。
技术介绍
机器学习方法被广泛用于图像分析,通过在给定数据集上训练模型来完成新数据上的特定任务,比如分类、识别和分割等。常用的算法有支持向量机(SVM),隐马尔科夫(HMM)以及人工神经网络等。然而,传统的机器学习算法祈要利用先验知识从原始数据中人工提取特征,从而训练模型。由于特征选取难度较大,模型可能存在过拟合问题,泛化能力难以保证;另一方面,传统模型难以适应大规模数据集,模型可扩展性差。深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习。深度学习是一种数据驱动型模型,能够模拟人脑视觉机理自动地学习到数据各个层次的抽象特征,从而更好地反映数据的本质特征。DeepID是目前效果不错的人脸图像识别算法,采用的就是深度学习的方法,在DeepID的实验过程中,使用的外部数据集为CelebFaces+,达到了97.20的效果。但是DeepID采用人脸身份证数据集进行实验,效果却不是很理想。这是因为人脸身份证数据集只是单类单幅数据集,本身没有类内距离,DeepID失去了一定的效果。在深度学习的应用中,时常就会碰到训练例如人脸身份证图片这样的单类单幅图像的问题解决上述问题的关键就是如何使得该模型能够克服训练数据集只有单类单幅数据集的形式,并能够使得训练数据集的类间距离更加大,类内距离更加小。根据单类单幅图片和单类多幅图片的关联性,利用单类多幅图片训练数据集含有的类内距离属性,弥补单类单幅图片 ...
【技术保护点】
1.一种基于海量单类单幅图像的图像分类网络训练方法,其特征在于:包括如下步骤:步骤一,数据准备:将包含N类单类单幅的图像数据集作为训练数据集1,将包含M类单类多幅的图像数据集作为训练数据集2,训练数据集1的图片数量要远多于训练数据集2的图片数量,所述单类单幅是每一类图像中仅包含一张该类的图像,单类多幅是每一类图像中包含多张同类的图像;步骤二,网络结构:在DeepID网络结构的基础上进行改进,将训练数据输入层替换为训练数据集1输入层和训练数据集2输入层两个网络层,将DeepID网络结构中的Soft‑max层替换为基于迭代次数的动态损失函数,基于迭代次数的动态损失函数会根据迭代次数的奇偶性对损失函数计算公式进行动态选择,将改进后的网络称为基于海量单类单幅图像的图像分类网络,所述DeepID网络结构包含四个卷积层、一个全连接层Fc1、一个Soft‑max层;步骤三,网络训练:当训练的迭代次数为奇数时,将训练数据集1作为基于海量单类单幅图像的图像分类网络的输入数据,步骤二中的基于迭代次数的动态损失函数采用类间距离损失函数,对网络进行训练,当迭代次数为偶数时,将训练数据集2作为基于海量单类单幅图 ...
【技术特征摘要】
1.一种基于海量单类单幅图像的图像分类网络训练方法,其特征在于:包括如下步骤:步骤一,数据准备:将包含N类单类单幅的图像数据集作为训练数据集1,将包含M类单类多幅的图像数据集作为训练数据集2,训练数据集1的图片数量要远多于训练数据集2的图片数量,所述单类单幅是每一类图像中仅包含一张该类的图像,单类多幅是每一类图像中包含多张同类的图像;步骤二,网络结构:在DeepID网络结构的基础上进行改进,将训练数据输入层替换为训练数据集1输入层和训练数据集2输入层两个网络层,将DeepID网络结构中的Soft-max层替换为基于迭代次数的动态损失函数,基于迭代次数的动态损失函数会根据迭代次数的奇偶性对损失函数计算公式进行动态选择,将改进后的网络称为基于海量单类单幅图像的图像分类网络,所述DeepID网络结构包含四个卷积层、一个全连接层Fc1、一个Soft-max层;步骤三,网络训练:当训练的迭代次数为奇数时,将训练数据集1作为基于海量单类单幅图像的图像分类网络的输入数据,步骤二中的基于迭代次数的动态损失函数采用类间距离损失函数,对网络进行训练,当迭代次数为偶数时,将训练数据集2作为基于海量单类单幅图像...
【专利技术属性】
技术研发人员:章东平,郑寅,陶禹诺,陈思瑶,毕崇圆,
申请(专利权)人:中国计量大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。