一种基于修复自监督任务的图像分类方法及装置制造方法及图纸

技术编号：32978438 阅读：15 留言：0更新日期：2022-04-09 12:00

本发明专利技术公开了一种基于修复自监督任务的图像分类方法及装置。其中，该方法包括：获取原始图像数据；将所述原始图像数据进行预处理，得到已处理图像数据；将所述已处理图像数据进行修复，得到待分类图像数据；将所述待分类图像数据进行分类，得到分类结果，其中，对所述待分类图像数据进行分类包括：利用高层语义表示通过卷积神经网络进行降维：M

全部详细技术资料下载

【技术实现步骤摘要】
一种基于修复自监督任务的图像分类方法及装置

[0001]本专利技术涉及图像数据处理领域，具体而言，涉及一种基于修复自监督任务的图像分类方法及装置。

技术介绍

[0002]随着智能化科技的不断发展，人们的生活、工作、学习之中越来越多地用到了智能化设备，使用智能化科技手段，提高了人们生活的质量，增加了人们学习和工作的效率。
[0003]图像分类是计算机视觉领域的基础任务之一，其基本目的是判断图像中包含的物体类别。随着计算机智能视觉领域的快速发展，图像分类技术也在不断完善。从一开始的传统方法，即手工提取图片特征到后来的深度学习方法，卷积神经网络可以挖掘出图片中更深层的语义信息。从2007年开始，学者李飞飞耗费大量人力通过各种方式（网络抓取，人工标注，亚马逊平台等）收集超过1500万的图像数据，大约包含2.2万类。基于这个数据集，从2010年开始举办了一个图像分类竞赛，即ImageNet Large
‑
Scale Visual Recognition Challenge（ILSVRC）。这个竞赛使得研究者们在图片分类领域上拓荒前进，相继提出AlexNet、VGG、GoogLeNet、ResNet和SENet等具有跨时代意义的深度网络编码模型。到目前为止，随着图片数据的增多，手工进行图片类别标注的代价也相继加大。训练深度学习需要大量的人工标注的样本，这是费时耗力的。因此，自监督模型的提出就是为了打破人工标注样本的限制，其目的是在没有人工标注的条件下也能高效且准确的训练神经网络。
[0004]针...

【技术保护点】

【技术特征摘要】
1.一种基于修复自监督任务的图像分类方法，其特征在于，包括：获取原始图像数据；将所述原始图像数据进行预处理，得到已处理图像数据；将所述已处理图像数据进行修复，得到待分类图像数据；将所述待分类图像数据进行分类，得到分类结果，其中，对所述待分类图像数据进行分类包括：利用高层语义表示通过卷积神经网络进行降维：M
x
= Conv4×4(H
x
,θ)，并根据降维后的所述语义信息M
x
运算得到最后的分类结果：其中W和b分别是多层感知机中的参数矩阵和偏置。2.根据权利要求1所述的方法，其特征在于，将所述原始图像数据进行预处理，得到已处理图像数据包括：将所述原始图像数据进行遮掩操作，得到遮掩后的图像数据和遮掩数据；通过合并所述遮掩后的图像数据和所述遮掩数据，生成所述已处理图像数据。3.根据权利要求1所述的方法，其特征在于，在将所述已处理图像数据进行修复，得到待分类图像数据之后，所述方法还包括：根据所述修复任务，保存用于所述待分类图像数据分类操作的中间模型。4.根据权利要求1所述的方法，其特征在于，在将所述待分类图像数据进行分类，得到分类结果之后，所述方法还包括：将所述分类结果进行展示。5.一种基于修复自监督任务的图像分类装置，其特征在于，包括：获取模块，用于获取原始图像数据；预处理模块，用于将所述原始图像数据进行预处理，得到已处理图像数据；修复模块，用于将所述已...

【专利技术属性】
技术研发人员：张凯，曲浩，宫永顺，逯天斌，
申请(专利权)人：山东力聚机器人科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人