信息处理装置和信息处理方法制造方法及图纸

技术编号:35974498 阅读:55 留言:0更新日期:2022-12-17 22:42
本公开内容涉及信息处理装置和信息处理方法。该信息处理装置用于对分类模型进行训练,该分类模型能够基于第一域的具有标签的第一样本对不同于第一域的第二域的不具有标签的第二样本进行分类,在第二样本的类别与第一样本的类别之间存在相同的共享类别。该信息处理装置包括:聚簇单元,使第二样本中的每个朝向其相邻的第一样本或第二样本聚簇;多个第一分类单元,每个第一分类单元基于第一样本的部分类别对经聚簇的第二样本分类;以及识别单元,基于多个第一分类单元的分类结果识别不具有共享类别的第二样本,其中分类模型使用聚簇单元的聚簇结果和识别单元的识别结果进行训练。根据本公开内容的信息处理技术,能够显著改善迁移学习的学习效果。改善迁移学习的学习效果。改善迁移学习的学习效果。

【技术实现步骤摘要】
信息处理装置和信息处理方法


[0001]本文公开的实施方式涉及信息处理的
特别地,本公开内容的实施方式涉及用于不同的域之间的迁移学习的信息处理装置和信息处理方法以及使用所述信息处理方法训练的分类模型。

技术介绍

[0002]近些年,深度学习在许多机器学习任务及应用中取得了很大的进步。随着越来越多的机器学习应用场景的出现,尽管有监督的机器学习呈现出较好的性能,但是训练需要大量的带标签的样本,然而给样本加标签,即标注样本,是一项耗时费力的工作,所以能够将在某个域(以下称为源域(Source Domain))中学习到的知识应用到不同但相关的另一域(以下称为目标域(Target Domain))中的迁移学习(Transfer Learning)受到越来越多的关注。
[0003]此外,许多跨域的机器学习任务基于训练样本集合(即源域的带标签的样本的集合)和测试集合(即目标域的无标签的样本的集合)共享相同类别的假设。然而,由于在实际应用中通常存在目标域的样本的类别与源域的样本的类别之间的差异,即存在域间的类别间隙,因此该假设在许多应用场景中并不成立。
[0004]图1A至图1D示出了关于源域和目标域的类别间隙的各种情况的示意图。在图1A至图1D中,源域可以是照片图像的域,而目标域可以是卡通图像的域。此外,如图1A至图1D中所示,例如,源域和目标域中的图像可以具有四种标签,即四个类别:床(Bed)、椅子(Chair)、自行车(Bike)和叉子(Fork)。具体地,图1A示出了被称为闭集域自适应(Closed<br/>‑
set Domain Adaptation:CDA)的应用场景,其中目标域的类别与源域的类别完全相同,即目标域的类别是源域的类别的全集,因此不存在类别间隙。图1B示出了部分域自适应(Partial Domain Adaptation:PDA)的应用场景,其中目标域的类别是源域的类别的一部分,即目标域的类别是源域的类别的子集,因此在目标域中存在未知的类别(Unknown)的样本,即在源域和目标域之间存在类别间隙。图1C示出了开集域自适应(Open

set Domain Adaptation:OSDA)的应用场景,其中源域的类别是目标域的类别的一部分,即源域的类别是目标域的类别的子集,因此存在在源域和目标域之间类别间隙。图1D示出了开放部分域自适应(Open Partial Domain Adaptation:OPDA)的应用场景,其中目标域的部分类别与源域的部分类别相同,即源域的类别与目标域的类别之间存在交集,因此存在在源域和目标域之间类别间隙。如图1A至图1D中所示,对于适用于迁移学习的应用场景,即使在存在类别间隙的情况下,在源域的类别和目标域的类别之间也应至少存在交集,即相同的共享类别。
[0005]因此,在现有技术中,仍需要提供一种通用化的用于域间的迁移学习的信息处理技术,其能够针对例如图1A至图1D所示的各种应用场景实现良好的迁移学习性能。

技术实现思路

[0006]在下文中将给出关于本公开内容的简要概述,以便提供关于本公开内容的某些方面的基本理解。应当理解,这个概述并不是关于本公开内容的穷举性概述。它并不是意图确定本公开内容的关键或重要部分,也不是意图限定本公开内容的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
[0007]对于上文指出的现有技术中存在的问题,有必要提供一种适用于各种应用场景的通用化的能够实现域间的迁移学习的信息处理技术,用于准确和快速地实现无标签样本的检测。
[0008]为了实现本公开内容的目的,根据本公开内容的一个方面,提供了一种信息处理装置,用于对分类模型进行训练,该分类模型能够基于第一域的具有标签的第一样本对不同于第一域的第二域的不具有标签的第二样本进行分类,在第二样本的类别与第一样本的类别之间存在相同的共享类别,该信息处理装置包括:聚簇单元,被配置成使第二样本中的每个朝向其相邻的第一样本或第二样本聚簇;多个第一分类单元,每个第一分类单元被配置成基于第一样本的部分类别对经聚簇的第二样本进行分类;以及识别单元,被配置成基于多个第一分类单元的分类结果识别不具有共享类别的第二样本,其中分类模型使用聚簇单元的聚簇结果和识别单元的识别结果进行训练。
[0009]根据本公开内容的另一方面,提供了一种信息处理方法,用于对分类模型进行训练,该分类模型能够基于第一域的具有标签的第一样本对不同于第一域的第二域的不具有标签的第二样本进行分类,在第二样本的类别与第一样本的类别之间存在相同的共享类别,该信息处理方法包括:使第二样本中的每个朝向其相邻的第一样本或第二样本聚簇;基于第一样本的部分类别对经聚簇的第二样本进行分类;基于分类结果识别不具有共享类别的第二样本;以及使用聚簇结果和识别结果训练分类模型。
[0010]根据本公开内容的又一方面,还提供了一种使用上文所述的信息处理方法训练的分类模型。
[0011]根据本公开内容的再一方面,还提供了能够实现上述的信息处理方法的计算机程序。
[0012]此外,还提供了具有至少计算机可读存储介质形式的计算机程序产品,其上记录有用于实现上述的信息处理方法的计算机程序代码。
[0013]本公开内容提出了一种新型的用于训练实现迁移学习的分类模型的信息处理技术,通过该信息处理技术训练的分类模型能够针对各种应用场景(具有域间类别间隙或不具有域间类别间隙)实现良好的迁移学习性能,而且较之传统的实现迁移学习的分类模型能够显著提高检测精度。
附图说明
[0014]参照下面结合附图对本公开内容实施方式的说明,会更加容易地理解本公开内容的以上和其它目的、特点和优点,在附图中:
[0015]图1A至图1D示出了关于源域和目标域的类别间隙的各种情况的示意图
[0016]图2示出了根据本公开内容的实施方式的信息处理装置的框图;
[0017]图3示出了根据本公开内容的实施方式的信息处理装置的结构的示意图;
[0018]图4示出了根据本公开内容的实施方式的信息处理装置的训练效果的示意图;
[0019]图5示出了根据本公开内容的实施方式的信息处理装置的训练效果的示意图;
[0020]图6示出了根据本公开内容的实施方式的信息处理方法的流程图;以及
[0021]图7示出了用于实现根据本公开内容的实施方式的信息处理方法的通用机器的结构简图。
具体实施方式
[0022]在下文中,将参照所附的说明性示图详细描述本公开内容的一些实施方式。在用附图标记指示附图的元件时,尽管相同的元件在不同的附图中示出,但相同的元件将由相同的附图标记表示。此外,在本公开内容的以下描述中,在有可能使本公开内容的主题不清楚的情况下,将省略对并入于本文中的已知功能和配置的详细描述。
[0023]本文中使用的术语仅用于描述特定实施方式的目的,而非旨在限制本公开内容。如本文所使用的,除非上下文另外指出,否则单数形式旨本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息处理装置,用于对分类模型进行训练,所述分类模型能够基于第一域的具有标签的第一样本对不同于所述第一域的第二域的不具有标签的第二样本进行分类,在所述第二样本的类别与所述第一样本的类别之间存在相同的共享类别,所述信息处理装置包括:聚簇单元,被配置成使所述第二样本中的每个朝向其相邻的第一样本或第二样本聚簇;多个第一分类单元,每个第一分类单元被配置成基于所述第一样本的部分类别对经聚簇的第二样本进行分类;以及识别单元,被配置成基于所述多个第一分类单元的分类结果识别不具有所述共享类别的第二样本,其中,所述分类模型使用所述聚簇单元的聚簇结果和所述识别单元的识别结果进行训练。2.根据权利要求1所述的信息处理装置,其中,所述分类模型通过卷积神经网络模型实现。3.根据权利要求2所述的信息处理装置,其中,所述分类模型包括特征提取单元和第二分类单元,所述特征提取单元被配置成提取所述第一样本和所述第二样本的特征量,以及所述第二分类单元被配置成基于所述第一样本的全部类别对所述第一样本和所述第二样本进行分类。4.根据权利要求1所述的信息处理装置,其中,对于所述第二样本中的每个样本,所述聚簇单元被配置成基于该样本与其相邻样本之间的距离进行聚簇。5.根据权利要求1所述的信息处理装置,其中,所述多个第一分类单元的部分类别的数目彼此相同。6...

【专利技术属性】
技术研发人员:冯成钟朝亮汪洁孙俊
申请(专利权)人:富士通株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1