训练分类模型的装置和方法及利用分类模型分类的装置制造方法及图纸

技术编号:25398107 阅读:39 留言:0更新日期:2020-08-25 23:02
公开了一种训练分类模型的装置和方法及利用分类模型分类的装置。训练分类模型的装置包括:获得局部区域单元,获得作为样本图像的全局区域中的一部分的预定局部区域;特征提取单元,针对每个样本图像,对于全局区域和每个预定局部区域分别设置相应数量的特征提取层,用以分别提取全局区域的全局特征和每个预定局部区域的局部特征,其中,全局区域和预定局部区域共享针对全局区域和每个预定局部区域分别设置的特征提取层中的至少一个层,以在所共享的所述至少一个层中将全局特征和每个局部特征进行结合;以及损失确定单元,利用损失确定层,基于每个样本图像的结合后的特征来计算该样本图像的损失函数,并基于损失函数来训练所述分类模型。

【技术实现步骤摘要】
训练分类模型的装置和方法及利用分类模型分类的装置
本公开涉及信息处理领域,具体涉及一种训练分类模型的装置和方法、以及利用分类模型进行分类的装置和方法。
技术介绍
近年来,由于大规模人脸数据、车辆数据等的收集和卷积神经网络的应用,人脸识别和车牌识别等分类技术在学术界和工业界都取得了很大的进展并得到了广泛的应用。目前提高人脸识别和车牌识别等分类性能的主要思路是提高分类模型的性能。然而,当应用场景出现姿态变化大、分辨率低、质量差等问题时,分类性能会明显降低。进一步地,可以通过增加数据来提高分类性能。然而,收集大规模的数据费事费力。就人脸数据而言,现在存在VGG2Face、Ms-Celeb-1M、MegaFace等公开的人脸数据集。每个数据集都有各自的优缺点,充分利用每个数据集的优点可以有效地提升分类性能。最简单的方法是直接将多个数据集放到一起,但不同数据集的数据有交叉,容易出现同一个数据在不同数据集中标注不一样的情况,简单地将多个数据集融合到一起容易使训练的分类模型不收敛或者性能更差。
技术实现思路
在下文中给出了关于本公开的简要概述,以便提供关于本公开的某些方面的基本理解。但是,应当理解,这个概述并不是关于本公开的穷举性概述。它并不是意图用来确定本公开的关键性部分或重要部分,也不是意图用来限定本公开的范围。其目的仅仅是以简化的形式给出关于本公开的某些概念,以此作为稍后给出的更详细描述的前序。鉴于以上问题,本公开的目的是提供能够解决现有技术中的一个或多个缺点的训练分类模型的装置和方法、以及利用分类模型进行分类的装置和方法。根据本公开的另一方面,提供了一种训练分类模型的装置,包括:获得局部区域单元,被配置成针对训练集中的每个样本图像,获得该样本图像的预定数量的预定局部区域,其中,每个预定局部区域是所述样本图像的全局区域中的一部分;特征提取单元,被配置成针对每个样本图像,对于所述全局区域和每个预定局部区域分别设置相应数量的特征提取层,用以分别提取所述全局区域的全局特征和每个预定局部区域的局部特征,其中,所述全局区域和所述预定数量的预定局部区域共享针对所述全局区域和每个预定局部区域分别设置的相应数量的特征提取层中的至少一个层,以在所共享的所述至少一个层中将所述全局特征和每个局部特征进行结合;以及损失确定单元,被配置成利用损失确定层,基于每个样本图像的结合后的特征来计算该样本图像的损失函数,并基于所述损失函数来训练所述分类模型。根据本公开的另一方面,提供了一种训练分类模型的方法,包括:获得局部区域步骤,针对训练集中的每个样本图像,获得该样本图像的预定数量的预定局部区域,其中,每个局部区域是所述样本图像的全局区域中的一部分;特征提取步骤,针对每个样本图像,对于所述全局区域和每个预定局部区域分别设置相应的特征提取层,用以分别提取所述全局区域的全局特征和每个预定局部区域的局部特征,其中,所述全局区域和所述预定数量的预定局部区域共享针对所述全局区域和每个预定局部区域分别设置的相应数量的特征提取层中的至少一个层,以在所共享的所述至少一个层中将所述全局特征和每个局部特征进行结合;以及损失确定步骤,利用损失确定层,基于每个样本图像的结合后的特征来计算该样本图像的损失函数,并基于所述损失函数来训练所述分类模型。根据本公开的另一方面,提供了一种利用分类模型进行分类的装置,包括:第二获得局部区域单元,被配置成获得待分类图像的预定数量的预定局部区域,其中,每个预定局部区域是所述待分类图像的全局区域中的一部分;第二特征提取单元,被配置成利用所述分类模型中的针对所述全局区域和每个局部区域而设置的相应数量的特征提取层来分别提取所述全局区域的全局特征和每个预定局部区域的局部特征,其中,在所述分类模型中,所述全局区域和所述预定数量的预定局部区域共享针对所述全局区域和每个预定局部区域分别设置的相应数量的特征提取层中的至少一个层,以在所共享的所述至少一个层中将所述全局特征和每个局部特征进行结合;以及第二损失确定单元,被配置成利用所述分类模型中的损失确定层,基于所述待分类图像的结合后的特征来计算所述待分类图像的损失函数,并基于所述损失函数来对所述待分类图像进行分类。根据本公开的其它方面,还提供了用于实现上述根据本公开的方法的计算机程序代码和计算机程序产品。在下面的说明书部分中给出本公开实施例的其它方面,其中,详细说明用于充分地公开本公开实施例的优选实施例,而不对其施加限定。附图说明本公开可以通过参考下文中结合附图所给出的详细描述而得到更好的理解,其中在所有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下面的详细说明一起包含在本说明书中并形成说明书的一部分,用来进一步举例说明本公开的优选实施例和解释本公开的原理和优点。其中:图1是示出根据本公开实施例的训练分类模型的装置的功能配置示例的框图;图2是示意性示出根据本公开实施例的训练分类模型的装置的一个结构配置示例的图;图3是示意性示出根据本公开实施例的训练分类模型的装置的另一结构配置示例的图;图4是示出根据本公开实施例的训练分类模型的方法的流程示例的流程图;图5是示出根据本公开实施例的利用预先训练的分类模型进行分类的装置的功能配置示例的框图;图6是示出根据本公开实施例的利用预先训练的分类模型进行分类的方法的流程示例的流程图;以及图7是示出作为本公开实施例中可采用的个人计算机的示例结构的框图。具体实施方式在下文中将结合附图对本公开的示范性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本公开,在附图中仅仅示出了与根据本公开的方案密切相关的设备结构和/或处理步骤,而省略了与本公开关系不大的其它细节。下面结合附图详细说明根据本公开的实施例。首先,将参照图1描述根据本公开实施例的训练分类模型的装置100的功能框图。图1是示出根据本公开实施例的训练分类模型的装置100的功能配置示例的框图。如图1所示,根据本公开实施例的训练分类模型的装置100包括获得局部区域单元102、特征提取单元104以及损失确定单元106。获得局部区域单元102可以被配置成针对训练集中的每个样本图像,获得该样本图像的预定数量的预定局部区域,其中,每个预定局部区域是样本图像的全局区域中的一部分。作为示例,全局区域是样本图像的整个区域,而局部区域是样本图像的整个区域中的一部分区域。以样本图像为人脸图像为例,获得局部区域单元102可以根据人脸5个关键本文档来自技高网...

【技术保护点】
1.一种训练分类模型的装置,包括:/n获得局部区域单元,被配置成针对训练集中的每个样本图像,获得该样本图像的预定数量的预定局部区域,其中,每个预定局部区域是所述样本图像的全局区域中的一部分;/n特征提取单元,被配置成针对每个样本图像,对于所述全局区域和每个预定局部区域分别设置相应数量的特征提取层,用以分别提取所述全局区域的全局特征和每个预定局部区域的局部特征,其中,所述全局区域和所述预定数量的预定局部区域共享针对所述全局区域和每个预定局部区域分别设置的相应数量的特征提取层中的至少一个层,以在所共享的所述至少一个层中将所述全局特征和每个局部特征进行结合;以及/n损失确定单元,被配置成利用损失确定层,基于每个样本图像的结合后的特征来计算该样本图像的损失函数,并基于所述损失函数来训练所述分类模型。/n

【技术特征摘要】
1.一种训练分类模型的装置,包括:
获得局部区域单元,被配置成针对训练集中的每个样本图像,获得该样本图像的预定数量的预定局部区域,其中,每个预定局部区域是所述样本图像的全局区域中的一部分;
特征提取单元,被配置成针对每个样本图像,对于所述全局区域和每个预定局部区域分别设置相应数量的特征提取层,用以分别提取所述全局区域的全局特征和每个预定局部区域的局部特征,其中,所述全局区域和所述预定数量的预定局部区域共享针对所述全局区域和每个预定局部区域分别设置的相应数量的特征提取层中的至少一个层,以在所共享的所述至少一个层中将所述全局特征和每个局部特征进行结合;以及
损失确定单元,被配置成利用损失确定层,基于每个样本图像的结合后的特征来计算该样本图像的损失函数,并基于所述损失函数来训练所述分类模型。


2.根据权利要求1所述的训练分类模型的装置,其中,
所述训练集包括多个训练集,所述多个训练集中的至少两个训练集至少部分重叠,
所述损失确定层包括分别与所述多个训练集对应的多个损失确定层,以及
所述损失确定单元被配置成针对来自所述多个训练集的每个样本图像,利用与该样本图像所属的训练集对应的损失确定层来计算该样本图像的损失函数。


3.根据权利要求2所述的训练分类模型的装置,其中,所述多个训练集共享针对每个训练集中的样本图像的所述全局区域设置的特征提取层中的至少一个层。


4.根据权利要求3所述的训练分类模型的装置,其中,所述多个训练集还共享针对每个训练集中的样本图像的所述预定数量的预定局部区域中的至少一个预定局部区域设置的特征提取层中的至少一个层。


5.根据权利要求1所述的训练分类模型的装置,其中,所述预定数量的局部区域具有关于所述全局区域的互补信息。


6.根据权利要求1所述的训练分类模型的装置,其中,所述特征提取层是卷积神经网络的卷积层。


7.一种训练分类模型的方法,包括:
获得局部区域步骤,针对训练集中的每个样本图像,获得该样本图像的预定数量的预定局部区域,其中,每个局部...

【专利技术属性】
技术研发人员:张梦刘汝杰
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1