一种半监督的图像分类器训练方法技术

技术编号：17796956 阅读：97 留言：0更新日期：2018-04-25 20:27

一种半监督的图像分类器训练方法，包括以下步骤：S1初始化分类器，包括分类器结构初始化、分类器权重初始化等；S2获取图像数据，以网络爬虫为主要方法大量获取包含所需数据的图像数据；S3对数据分类和标记；S4迭代更新分类器；S5判断是否结束程序或继续迭代；本发明专利技术对基础的图像分类器有较好的优化效果，训练得到的分类器的分类精度和鲁棒性都较高。

A semi supervised training method for image classifier

A semi supervised training method of image classifier, which includes the following steps: S1 initialization classifier, including classifier structure initialization, classifier weight initialization, and so on; S2 obtains image data, uses the network crawler as the main method to obtain the image data containing the required data; S3 is used to classify and mark data; S4 iterative update Classifier; S5 determines whether to end the program or continue to iterate; the invention has better optimization effect on the base image classifier, and the classification accuracy and robustness of the trained classifier are all high.

全部详细技术资料下载

【技术实现步骤摘要】
一种半监督的图像分类器训练方法
本专利技术涉及半监督学习和网络爬虫技术，借鉴了课程学习(CurriculumLearning)的思想，以深度卷积神经网络(ConvolutionalNeuralNetworks，CNN)为例验证此方法在机器学习上的效果，在OXfordPets和CIFAR-10图像数据集上测试，提出并验证了一种半监督的机器学习方法，其在图像分类器的训练中效果明显。
技术介绍
图像精细分类(FGVC)旨在区分入门级别的分类，如狗，鸟，食品，鲜花，汽车和衣服。由于这些分类类别的类内差异较大并且类间差异小，因此近年来受到计算机视觉界的普遍关注。传统上，FGVC总是通过两个基本步骤实现：特征提取和分类。然而，与深度卷积神经网络CNN相比，这种系统不太方便，性能较低。虽然CNN在许多FGVC问题中达到了最好的效果，由于以下两个原因，似乎有较大的潜力被进一步改善：首先，收集更多相同子类别的图像会大大降低类内差异，从而可能会增加许多机器学习算法的性能；其次，目前的CNN架构总是包含相当多的参数，需要更大量的训练数据来实现相当好的性能。随着机器学习技术的应用越来越广泛，尤其是深度学习技术的发展，依赖于深度学习的机器学习方法的设计变得越来越简单，而训练数据集的获取成为了限制机器学习最大的门槛。传统的机器学习所用的数据集都为人工采集，即便是用互联网爬取的数据，也需要人为的进行标注和筛选。传统的机器学习方法难以有效应对随机选择图像的子类分类，而卷积神经网络则可以在大数据的基础上较好的解决此问题。卷积神经网络(CNN)是深度学习算法的一种，近年来成为图像识别领域重要...
一种半监督的图像分类器训练方法

【技术保护点】
一种半监督的图像分类器训练方法，其特征在于：包括以下步骤：S1：初始化分类器，包括分类器结构初始化和分类器权重初始化；S2：获取图像数据，以网络爬虫为方法大量获取包含所需数据的图像数据；S3：对数据分类和标记；S4：迭代更新分类器；S5：判断是否结束程序或继续迭代：即判断分类器精度是否达到要求，是则至步骤S3，否则结束程序。

【技术特征摘要】
1.一种半监督的图像分类器训练方法，其特征在于：包括以下步骤：S1：初始化分类器，包括分类器结构初始化和分类器权重初始化；S2：获取图像数据，以网络爬虫为方法大量获取包含所需数据的图像数据；S3：对数据分类和标记；S4：迭代更新分类器；S5：判断是否结束程序或继续迭代：即判断分类器精度是否达到要求，是则至步骤S3，否则结束程序。2.根据权利要求1所述的一种半监督的图像分类器训练方法，其特征在于：所述步骤S1包含以下步骤：S1.1：初始化分类器结构，如采用深度卷积神经网络为分类器结构；S1.2：用初始化函数初始化分类器权重，或者使用ImageNet数据集预训练图像分类器；S1.3：保存分类器参数作为最新的分类器。3.根据权利要求1或2所述的一种半监督的图像分类器训练方法，其特征在于：所述步骤S2包括以下步骤：S2.1：用人工采集补充图像...

【专利技术属性】
技术研发人员：宣琦，肖浩泉，刘毅，陈晋音，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人