一种基于修复自监督任务的图像分类方法及装置制造方法及图纸

技术编号:32978438 阅读:14 留言:0更新日期:2022-04-09 12:00
本发明专利技术公开了一种基于修复自监督任务的图像分类方法及装置。其中,该方法包括:获取原始图像数据;将所述原始图像数据进行预处理,得到已处理图像数据;将所述已处理图像数据进行修复,得到待分类图像数据;将所述待分类图像数据进行分类,得到分类结果,其中,对所述待分类图像数据进行分类包括:利用高层语义表示通过卷积神经网络进行降维:M

【技术实现步骤摘要】
一种基于修复自监督任务的图像分类方法及装置


[0001]本专利技术涉及图像数据处理领域,具体而言,涉及一种基于修复自监督任务的图像分类方法及装置。

技术介绍

[0002]随着智能化科技的不断发展,人们的生活、工作、学习之中越来越多地用到了智能化设备,使用智能化科技手段,提高了人们生活的质量,增加了人们学习和工作的效率。
[0003]图像分类是计算机视觉领域的基础任务之一,其基本目的是判断图像中包含的物体类别。随着计算机智能视觉领域的快速发展,图像分类技术也在不断完善。从一开始的传统方法,即手工提取图片特征到后来的深度学习方法,卷积神经网络可以挖掘出图片中更深层的语义信息。从2007年开始,学者李飞飞耗费大量人力通过各种方式(网络抓取,人工标注,亚马逊平台等)收集超过1500万的图像数据,大约包含2.2万类。基于这个数据集,从2010年开始举办了一个图像分类竞赛,即ImageNet Large

Scale Visual Recognition Challenge(ILSVRC)。这个竞赛使得研究者们在图片分类领域上拓荒前进,相继提出AlexNet、VGG、GoogLeNet、ResNet和SENet等具有跨时代意义的深度网络编码模型。到目前为止,随着图片数据的增多,手工进行图片类别标注的代价也相继加大。训练深度学习需要大量的人工标注的样本,这是费时耗力的。因此,自监督模型的提出就是为了打破人工标注样本的限制,其目的是在没有人工标注的条件下也能高效且准确的训练神经网络。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种基于修复自监督任务的图像分类方法及装置,以至少解决现有技术中随着图片数据的增多,手工进行图片类别标注的代价也相继加大,因此在训练深度学习需要大量的人工标注的样本的技术问题。
[0006]根据本专利技术实施例的一个方面,提供了一种基于图像修复自监督任务的图像分类方法,包括:获取原始图像数据;将所述原始图像数据进行预处理,得到已处理图像数据;将所述已处理图像数据进行修复,得到待分类图像数据;将所述待分类图像数据进行分类,得到分类结果,其中,对所述待分类图像数据进行分类包括:利用高层语义表示通过卷积神经网络进行降维:M
x
= Conv4×4(H
x
,θ),并根据降维后的所述语义信息M
x
运算得到最后的分类结果: ,其中W和b分别是多层感知机中的参数矩阵和偏置。
[0007]可选的,将所述原始图像数据进行预处理,得到已处理图像数据包括:将所述原始图像数据进行遮掩操作,得到遮掩后的图像数据和遮掩数据;通过合并所述遮掩后的图像数据和所述遮掩数据,生成所述已处理图像数据。
[0008]可选的,在将所述已处理图像数据进行修复,得到待分类图像数据之后,所述方法还包括:根据所述修复任务,保存用于所述待分类图像数据分类操作的中间模型。
[0009]可选的,在将所述待分类图像数据进行分类,得到分类结果之后,所述方法还包
括:将所述分类结果进行展示。
[0010]根据本专利技术实施例的另一方面,还提供了一种基于修复自监督任务的图像分类装置,包括:获取模块,用于获取原始图像数据;预处理模块,用于将所述原始图像数据进行预处理,得到已处理图像数据;修复模块,用于将所述已处理图像数据进行修复,得到待分类图像数据;分类模块,用于将所述待分类图像数据进行分类,得到分类结果。
[0011]可选的,所述预处理模块包括:遮掩单元,用于将所述原始图像数据进行遮掩操作,得到遮掩后的图像数据和遮掩数据;合并单元,用于通过合并所述遮掩后的图像数据和所述遮掩数据,生成所述已处理图像数据。
[0012]可选的,所述装置还包括:保存模块,用于根据所述修复任务,保存用于所述待分类图像数据分类操作的中间模型。
[0013]可选的,所述装置还包括:展示模块,用于将所述分类结果进行展示。
[0014]根据本专利技术实施例的另一方面,还提供了一种非易失性存储介质,所述非易失性存储介质包括存储的程序,其中,所述程序运行时控制非易失性存储介质所在的设备执行一种基于图像修复自监督任务的图像分类方法。
[0015]根据本专利技术实施例的另一方面,还提供了一种电子装置,包含处理器和存储器;所述存储器中存储有计算机可读指令,所述处理器用于运行所述计算机可读指令,其中,所述计算机可读指令运行时执行一种基于图像修复自监督任务的图像分类方法。
[0016]在本专利技术实施例中,采用获取原始图像数据;将所述原始图像数据进行预处理,得到已处理图像数据;将所述已处理图像数据进行修复,得到待分类图像数据;将所述待分类图像数据进行分类,得到分类结果,其中,对所述待分类图像数据进行分类包括:利用高层语义表示通过卷积神经网络进行降维:M
x
= Conv4×4(H
x
,θ),并根据降维后的所述语义信息Mx运算得到最后的分类结果: ,其中W和b分别是多层感知机中的参数矩阵和偏置的方式,解决了现有技术中随着图片数据的增多,手工进行图片类别标注的代价也相继加大,因此在训练深度学习需要大量的人工标注的样本的技术问题。
附图说明
[0017]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种基于修复自监督任务的图像分类方法的实施流程图;图2是根据本专利技术实施例的一种基于修复自监督任务的图像分类方法的图像修复网络图图3是根据本专利技术实施例的一种基于修复自监督任务的图像分类方法的图像修复网络编码器示意图;图4是根据本专利技术实施例的一种基于修复自监督任务的图像分类方法的图像分类网络示意图;图5是根据本专利技术实施例的一种基于修复自监督任务的图像分类方法的流程图;图6是根据本专利技术实施例的一种基于修复自监督任务的图像分类装置的结构框图。
具体实施方式
[0018]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0019]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于修复自监督任务的图像分类方法,其特征在于,包括:获取原始图像数据;将所述原始图像数据进行预处理,得到已处理图像数据;将所述已处理图像数据进行修复,得到待分类图像数据;将所述待分类图像数据进行分类,得到分类结果,其中,对所述待分类图像数据进行分类包括:利用高层语义表示通过卷积神经网络进行降维:M
x
= Conv4×4(H
x
,θ),并根据降维后的所述语义信息M
x
运算得到最后的分类结果:其中W和b分别是多层感知机中的参数矩阵和偏置。2.根据权利要求1所述的方法,其特征在于,将所述原始图像数据进行预处理,得到已处理图像数据包括:将所述原始图像数据进行遮掩操作,得到遮掩后的图像数据和遮掩数据;通过合并所述遮掩后的图像数据和所述遮掩数据,生成所述已处理图像数据。3.根据权利要求1所述的方法,其特征在于,在将所述已处理图像数据进行修复,得到待分类图像数据之后,所述方法还包括:根据所述修复任务,保存用于所述待分类图像数据分类操作的中间模型。4.根据权利要求1所述的方法,其特征在于,在将所述待分类图像数据进行分类,得到分类结果之后,所述方法还包括:将所述分类结果进行展示。5.一种基于修复自监督任务的图像分类装置,其特征在于,包括:获取模块,用于获取原始图像数据;预处理模块,用于将所述原始图像数据进行预处理,得到已处理图像数据;修复模块,用于将所述已...

【专利技术属性】
技术研发人员:张凯曲浩宫永顺逯天斌
申请(专利权)人:山东力聚机器人科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1