对象识别模型的训练方法、对象识别的方法、电子设备技术

技术编号:35750874 阅读:16 留言:0更新日期:2022-11-26 18:56
本申请提供了一种对象识别模型的训练方法、对象识别的方法、图像识别方法、电子设备及存储介质,对象识别模型的训练方法是利用经过伪标签标注后的第一图像样本集合对初始模型进行第一阶段训练,得到初步训练后的模型;伪标签是利用未标注的第一图像样本集合确定的;利用经过软标签标注后的第二图像样本集合对初步训练后的模型进行第二阶段训练,获得对象识别模型;软标签是利用未标注的第一图像样本集合和未标注的第二图像样本集合确定的。本申请实施例提供的图像识别方法把对于对象识别模型的训练过程拆分为两个阶段。在第二阶段可以直接利用第一阶段的伪标签得到软标签。第二阶段无需再进行聚类计算,从而节省聚类计算导致的计算开销。致的计算开销。致的计算开销。

【技术实现步骤摘要】
对象识别模型的训练方法、对象识别的方法、电子设备


[0001]本申请涉及图像识别
,尤其涉及一种对象识别模型的训练方法、对象识别的方法、图像识别的方法、电子设备及存储介质。

技术介绍

[0002]在模型训练场景,由于人工标注的成本不断提高。因此如何利用无监督方式对模型进行训练便成为越来越热门的研究领域。
[0003]无监督方式的训练其原理是利用没有标注的样本进行学习,以发现训练样本集中的结构性知识,从而解决问题。例如解决分类问题、解决预测问题等。
[0004]在利用大规模无标注样本进行训练的场景下,通常采用聚类的方式得到伪标签信息,从而完成模型的训练。但聚类过程对于图形处理器(Graphics Processing Unit,GPU)的显存以及计算量的极大需求,以路侧图像采集设备采集到的图像样本为示例,由于图像样本中的内容较多,因此聚类过程会导致高昂的资源消耗。

技术实现思路

[0005]本申请实施例提供一种对象识别模型的训练方法、对象识别的方法、图像识别的方法、电子设备及存储介质。
[0006]第一方面,本申请实施例提供了一种对象识别的方法,该方法可以包括以下步骤:获取候选图像;将包含目标对象的参照图像和候选图像输入至预先训练好的对象识别模型,识别出包含目标对象的候选图像。
[0007]第二方面,本申请实施例提供了一种对象识别模型的训练方法,该方法可以包括以下步骤:利用经过伪标签标注后的第一图像样本集合对初始模型进行第一阶段训练,得到初步训练后的模型;伪标签是利用未标注的第一图像样本集合确定的;利用经过软标签标注后的第二图像样本集合对初步训练后的模型进行第二阶段训练,获得对象识别模型;软标签是利用未标注的第一图像样本集合和未标注的第二图像样本集合确定的。
[0008]第三方面,本申请实施例提供了一种图像识别的方法,应用增强现实设备和/或虚拟现实设备,包括:获取候选图像;将包含目标对象的参照图像和候选图像输入至预先训练好的对象识别模型,识别出包含目标对象的候选图像;将包含目标对象的候选图像渲染至增强现实设备和/或虚拟现实设备的显示器上。
[0009]第四方面,本申请实施例提供了一种对象识别的装置,该装置可以包括:
获取模块,用于获取候选图像;识别模块,用于将包含目标对象的参照图像和候选图像输入至预先训练好的对象识别模型,识别出包含目标对象的候选图像。
[0010]第五方面,本申请实施例提供了一种对象识别模型的训练装置,该装置可以包括:第一阶段训练模块,用于利用经过伪标签标注后的第一图像样本集合对初始模型进行第一阶段训练,得到初步训练后的模型;伪标签是利用未标注的第一图像样本集合确定的;第二阶段训练模块,用于利用经过软标签标注后的第二图像样本集合对初步训练后的模型进行第二阶段训练,获得对象识别模型;软标签是利用未标注的第一图像样本集合和未标注的第二图像样本集合确定的。
[0011]第六方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器在执行所述计算机程序时实现上述任一项所述的方法。
[0012]第七方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法。
[0013]与现有技术相比,本申请具有如下优点:依据本申请实施例,相比于直接利用聚类技术对未标注的样本特征进行聚类标注得到伪标签以完成模型训练。本申请实施例可以把对于对象识别模型的训练过程拆分为两个阶段,第一阶段对未标注的样本特征进行聚类标注,得到伪标签。在第二阶段可以直接利用第一阶段的聚类标注结果或者伪标签得到软标签。即,在第二阶段无需再进行聚类计算,尤其对于路侧图像采集设备采集到的图像样本的情况,对于复杂的图像样本处理,可以节省聚类计算导致的计算开销。同时,由于第二阶段利用经过软标签标注的样本进行模型训练,可以提高模型的泛化性,保障了对象识别模型的识别请准度。
[0014]上述说明仅是本申请技术方案的概述 ,为了能够更清楚了解本申请的技术手段,可依照说明书的内容予以实施,并且为了让本申请的上述和其他目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
[0015]在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本申请的一些实施方式,而不应将其视为是对本申请范围的限制。
[0016]图1为本申请提供的基于对象识别方法的场景示意图;图2为本申请一实施例的对象识别的方法的流程图;图3是本申请一实施例的对象识别模型的训练方法的流程图;图4是本申请一实施例的确定伪标签的示意图;图5是本申请一实施例的确定软标签的示意图;图6是本申请一实施例的确定类中心的示意图;图7是本申请一实施例的对类中心进行更新的示意图;图8是本申请一实施例的对象识别的装置的结构框图;图9是本申请一实施例的对象识别模型的训练装置的结构框图;以及
图10为用来实现本申请实施例的电子设备的框图。
具体实施方式
[0017]在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本申请的构思或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的,而非限制性的。
[0018]为便于理解本申请实施例的技术方案,以下对本申请实施例的相关技术进行说明。以下相关技术作为可选方案与本申请实施例的技术方案可以进行任意结合,其均属于本申请实施例的保护范围。
[0019]首先对本申请所涉及的名词进行解释。
[0020]深度学习(Deep Learning):深度学习是指多层神经网络上运用各种机器学习算法解决图像,文本、音视频等各种问题的算法集合。示例性地,例如图像中的对象识别、文本的摘要生成、音视频的相关信息生成等。深度学习的核心是特征学习,旨在通过分层网络获取分层次的特征信息,从而解决以往需要人工设计特征的重要难题。
[0021]人工神经网络( Artificial Neural Networks,ANNs):也可简称为神经网络(Neural Networks)或连接模型(Connectionist Model)。人工神经网络是从信息处理角度对人脑神经元网络进行抽象并建立起的一种运算模型,按不同的连接方式组成不同的网络。人工神经网络具有自学习功能。例如在图像识别场景,将图像样本和对应的标签输入人工神经网络,网络就会通过自学习功能,学会识别类似的图像。
[0022]元学习(Meta Learning):元学习使得模型获取调整超参数的能力,使得模型可以在获取已有知识的基础上快速学习新的任务。元学习解决了学会学习(learning to learn)的问题。元学习和传统机器学习的区别在于,机器学习是先人为调参,之后直接训练特定任务下深度模型,元学习则是本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对象识别的方法,其特征在于,包括:获取候选图像;将包含目标对象的参照图像和所述候选图像输入至预先训练好的对象识别模型,识别出包含所述目标对象的候选图像。2.根据权利要求1所述的方法,其特征在于,还包括:利用所述包含所述目标对象的候选图像,确定所述目标对象的相关信息;所述相关信息包括所述目标对象的标识信息和所述目标对象的位置信息中的至少一种。3.一种对象识别模型的训练方法,其特征在于,包括:利用经过伪标签标注后的第一图像样本集合对初始模型进行第一阶段训练,得到初步训练后的模型;所述伪标签是利用未标注的第一图像样本集合确定的;利用经过软标签标注后的第二图像样本集合对所述初步训练后的模型进行第二阶段训练,获得对象识别模型;所述软标签是利用所述未标注的第一图像样本集合和未标注的第二图像样本集合确定的。4.根据权利要求3所述的方法,其特征在于,所述伪标签的确定方式,包括:利用所述初始模型提取所述未标注的第一图像样本集合的特征,得到第一特征提取结果;将所述第一特征提取结果进行聚类处理,得到至少一个特征簇;所述特征簇用于表征候选对象的特征,所述候选对象是出现在所述未标注的第一图像样本集合的各图像样本中的对象;根据所述特征簇确定伪标签。5.根据权利要求3所述的方法,其特征在于,所述软标签的确定方式,包括:利用所述初步训练后的模型对所述未标注的第二图像样本集合进行特征提取,得到第二特征提取结果;利用所述第二特征提取结果与类中心的相似性,确定软标签;所述类中心是利用所述未标注的第一图像样本集合确定的,所述类中心用于表征特征。6.根据权利要求5所述的方法,其特征在于,所述类中心的确定方式,包括:利用所述初始模型提取所述未标注的第一图像样本集合的特征,得到第一特征提取结果;将所述第一特征提取结果进行聚类处理,得到至少一个特征簇;所述特征簇用于表征候选对象的特征,所述候选对象是出现在所述未标注的第一图像样本集合的各图像样本中的对象;分别对每个所述特征簇进行类中心计算,得到对应的类中心计算结果。7.根据权利要求5或6所述的方法,其特征在于,还包括对所述类中心进行更新的步骤:所...

【专利技术属性】
技术研发人员:何天宇金鑫沈旭黄建强余文杰
申请(专利权)人:阿里巴巴达摩院杭州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1