基于半监督学习和细粒度特征学习的分类优化方法技术

技术编号：20918405 阅读：51 留言：0更新日期：2019-04-20 10:05

本发明专利技术涉及计算机视觉的技术领域，更具体地，涉及基于半监督学习和细粒度特征学习的分类优化方法。本发明专利技术是一种利用半监督学习来筛选伪标签数据，并且指定一种细粒度图片特征提取、利用方法来提升神经网络的泛化能力，以提升分类网络其在细粒度分类任务上的表现。包括：通过伪标签数据来扩充数据集；通过SSD对输入图片进行目标检测，对检测结果通过多个尺度进行裁剪，将检测结果和裁剪得到的图像块一起送入分类网络中学习，通过加权输出抑制背景块的影响。本发明专利技术还涉及到迁移学习，具体涉及到利用ImageNet数据集上的预训练模型的，冻结卷积层，微调全连接层，极大的节省了训练内存，节省了训练时间。

Classification optimization method based on semi-supervised learning and fine-grained feature learning

The invention relates to the technical field of computer vision, and more specifically to a classification optimization method based on semi-supervised learning and fine-grained feature learning. The invention uses semi-supervised learning to screen pseudo-label data, specifies a fine-grained image feature extraction method, and improves the generalization ability of the neural network to enhance the performance of the classification network on the fine-grained classification task. Including: expanding the data set by pseudo-label data; detecting the target of the input picture by SSD, clipping the detection result by multiple scales, sending the detection result and the clipped image block into the classification network to learn together, and suppressing the influence of the background block by weighted output. The invention also relates to migration learning, in particular to the use of pre-training model on ImageNet data set, freezing convolution layer, fine-tuning full connection layer, which greatly saves training memory and training time.

全部详细技术资料下载

【技术实现步骤摘要】
基于半监督学习和细粒度特征学习的分类优化方法
本专利技术涉及计算机视觉的
，更具体地，涉及基于半监督学习和细粒度特征学习的分类优化方法。
技术介绍
细粒度图像识别是图像分类领域中一个子任务，它的目标是在一个大类中的数百数千个子类中正确识别目标。相同的子类中物体的差异可能大不相同，不同的子类中物体可能又有着较高的相似度，再加上可用于训练的细分类数据集小，这是识别他们的三大难点。如何有效地对输入对象进行检测，并从中找到重要的局部区域信息，成为了细粒度图像分类算法要解决的关键问题，现有的方法解决细粒度分类问题按照其使用的监督信息的多少可以分为两类：基于强监督信息的分类模型和弱监督信息的分类模型两大类。基于强监督信息的细粒度图像分类模型是指，在模型训练时，除了图像的类别标签外，还使用了物体标注框和部位标注点等额外的人工标注信息，以此来获得更好的分类精度。基于弱监督信息的细粒度图像分类模型则希望在不借助partannotation的情况下，依赖于本身的算法来完成物体和局部区域的检测，也可以捕捉到所需要的局部信息，以达到结合全局信息和局部信息来做细粒度级别的分类。对于训练集不足的问题，一般可以通过迁移学习和半监督学习来解决，迁移学习通过大型数据集上训练好模型来在新的任务上做微调，半监督学习通过使用无标记数据来扩充可训练数据集样本。训练一个卷积神经网络往往需要较高的GPU内存和长时间的迭代训练，而如何把无标记样本正确利用起来是半监督学习一个难题。目前尚未发现在具备高精确度、能解决训练样本不足并且能极大缩短运行时间，节省内存，提高时效的专利或者文献。
技术实现思路
本专...

【技术保护点】
1.基于半监督学习和细粒度特征学习的分类优化方法，其特征在于，包括以下步骤：S1. 对无标记数据做投票操作，挑选具有一致的结果且不属于混淆类的数据当做伪标签；S2. 用挑选好的伪标签扩充训练集；S3. 选定一张有标记图片，得到检测结果图A；S4. 将上一步得到的图A进行随机裁剪得到图片；S5. 将裁剪得到的图像块和图A一起送进网络去学习；S6. 选定待测试图片，得到检测结果图B；S7. 将图B划分大小，裁剪图像块；S8. 将裁剪得到图像块以及图B一起做预测；S9. 对上一步得到的每张图像块的预测结果，用最大预测概率减去次大预测概率作为他们的权重，累加加权后的概率，取最大概率所在类别当做测试图片的最终结果。

【技术特征摘要】
1.基于半监督学习和细粒度特征学习的分类优化方法，其特征在于，包括以下步骤：S1.对无标记数据做投票操作，挑选具有一致的结果且不属于混淆类的数据当做伪标签；S2.用挑选好的伪标签扩充训练集；S3.选定一张有标记图片，得到检测结果图A；S4.将上一步得到的图A进行随机裁剪得到图片；S5.将裁剪得到的图像块和图A一起送进网络去学习；S6.选定待测试图片，得到检测结果图B；S7.将图B划分大小，裁剪图像块；S8.将裁剪得到图像块以及图B一起做预测；S9.对上一步得到的每张图像块的预测结果，用最大预测概率减去次大预测概率作为他们的权重，累加加权后的概率，取最大概率所在类别当做测试图片的最终结果。2.根据权利要求1所述的基于半监督学习和细粒度特征学习的分类优化方法，其特征在于：所述的步骤S3和S6中，用SSD检测，得到检测结果。3.根据权...

【专利技术属性】
技术研发人员：赖丹宇，陈龙，
申请(专利权)人：中山大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人