对象分类及模型训练方法、装置、介质和系统制造方法及图纸

技术编号:18351228 阅读:36 留言:0更新日期:2018-07-02 00:59
本申请提供了一种对象分类及模型训练方法、装置、介质和系统。对象分类模型包括特征提取器和分类器。训练方法包括:经特征提取器从包含对象的数据项中提取对象的特征;经分类器从预定义的候选类别集中下采样出部分类别,获取所提取的特征对于下采样出的部分类别的响应,以及基于响应对对象进行分类;以及根据分类的结果调整分类器和/或特征提取器中的参数。

【技术实现步骤摘要】
对象分类及模型训练方法、装置、介质和系统
本申请涉及人工智能(AI)领域,更具体地,涉及一种对象分类及模型训练方法、装置、介质和系统。
技术介绍
近年来,得益于深度学习的发展,在AI领域中发生了诸多技术突破。AI领域具有许多分支发展方向,但对象分类问题始终是一个核心问题。在对象分类问题中,往往为待分类的对象预定义一些候选类别。当候选类别增加时,分类的难度增加。例如,用于执行分类的模型的训练难度增加。当候选类别增加到一定程度时(例如,数十万量级甚至数百万量级),该对象分类问题演变为超大规模分类(MassiveClassification)问题。
技术实现思路
本申请提供了用于对象分类及其训练的技术方案。本申请实施例的一方面提供了一种对象分类模型的训练方法。对象分类模型包括特征提取器和分类器。训练方法包括:经特征提取器从包含对象的数据项中提取对象的特征;经分类器从预定义的候选类别集中下采样出部分类别,获取所提取的特征对于下采样出的部分类别的响应,以及基于响应对对象进行分类;以及根据分类的结果调整分类器和/或特征提取器中的参数。根据本申请实施例,根据分类的结果调整分类器中的参数可包括:根据分类的结果调整分类器中用于对对象进行分类的参数。根据本申请实施例,经分类器从预定义的候选类别集中下采样出部分类别可包括:经分类器并根据分类器中用于对对象进行分类的参数,从预定义的候选类别集中下采样出部分类别。根据本申请实施例,根据分类的结果调整分类器中的参数可包括:将调整参数的过程分成多个阶段,多个阶段中的每一阶段包括一定数量的训练循环;以及在每一阶段的起始时调整对对象进行分类时的参数。根据本申请实施例,用于对对象进行分类的参数可包括以下至少之一:下采样的部分类别的数量、基于候选类别集生成的类别簇的数量、类别簇的更新周期。根据本申请实施例,可随着训练的进行逐渐减少下采样的部分类别的数量、逐渐增加基于候选类别集生成的类别簇的数量、和/或逐渐增加单个阶段中训练循环的次数。根据本申请实施例,从预定义的候选类别集中下采样出部分类别可包括:将候选类别逐层二分成二叉树,二叉树的每个叶节点所包含的类别的数量小于或等于第一数量;将特征从二叉树的根节点出发逐层归入二叉树的下一节点,直至特征所归入的节点包含的类别的数量满足预定类别簇的数量;以及基于特征所归入的节点选取部分类别。根据本申请实施例,二叉树可为多个。根据本申请实施例,将候选类别逐层二分成二叉树可包括:基于候选类别中任意两个类别,构建候选类别所在的欧式空间中的第一超平面,第一超平面将欧式空间分为两个第一子空间;以及对于包含大于第一数量的类别的第一子空间,基于第一子空间中任意两个类别作为第二超平面迭代划分第一子空间,直至所划分出的子空间所包含的类别的数量小于或等于第一数量。本申请的另一方面提供了一种对象分类方法,包括:通过特征提取器从待处理的数据项中提取对象的特征;通过分类器基于提取的特征和预定义的候选类别集进行对象分类,其中,特征提取器和分类器利用上述训练方法预先训练完成。本申请实施例的另一方面提供了一种对象分类装置,该对象分类装置包括:特征提取器,特征提取器从包含对象的数据项中提取对象的特征;分类器,分类器从预定义的候选类别集中下采样出部分类别,获取所提取的特征对于下采样出的部分类别的响应,以及基于响应对对象进行分类;以及训练器,训练器根据分类的结果调整分类器和/或特征提取器中的参数。根据本申请实施例,训练器可根据分类的结果调整分类器中用于对对象进行分类的参数。根据本申请实施例,分类器可根据分类器中用于对对象进行分类的参数,从预定义的候选类别集中下采样出部分类别。根据本申请实施例,训练器可包括:训练计数器,训练计数器将调整参数的过程分成多个阶段,多个阶段中的每一阶段包括一定数量的训练循环;以及更新器,更新器在每一阶段的起始时调整对对象进行分类时的参数。根据本申请实施例,用于对对象进行分类的参数可包括以下至少之一:下采样的部分类别的数量、基于候选类别集生成的类别簇的数量、类别簇的更新周期。根据本申请实施例,训练器可随着训练的进行逐渐减少下采样的部分类别的数量、逐渐增加基于候选类别集生成的类别簇的数量、和/或逐渐增加单个阶段中训练循环的次数。根据本申请实施例,分类器可包括:二叉树构建器,二叉树构建器将候选类别逐层二分成二叉树,二叉树的每个叶节点所包含的类别的数量小于或等于第一数量;寻址器,寻址器将特征从二叉树的根节点出发逐层归入二叉树的下一节点,直至特征所归入的节点包含的类别的数量满足预定类别簇的数量;以及部分类别提取器,部分类别提取器基于特征所归入的节点选取部分类别。根据本申请实施例,二叉树可为多个。根据本申请实施例,二叉树构建器可包括:树干构建器,树干构建器基于候选类别中任意两个类别,构建候选类别所在的欧式空间中的第一超平面,第一超平面将欧式空间分为两个第一子空间;枝叶构建器,枝叶构建器对于包含大于第一数量的类别的第一子空间,基于第一子空间中任意两个类别作为第二超平面迭代划分第一子空间,直至所划分出的子空间所包含的类别的数量小于或等于第一数量。本申请的另一方面提供了一种对象分类装置,该对象分类装置包括:特征提取器,特征提取器从待处理的数据项中提取对象的特征;分类器,基于提取的特征和预定义的候选类别集进行对象分类,其中,特征提取器和分类器利用上述训练方法预先训练完成。本申请实施例的再一方面提供了一种用于对象分类模型的系统。训练系统包括:存储器,存储可执行指令;以及一个或多个处理器,与存储器通信以执行可执行指令从而完成与上述训练方法对应的操作或者完成如上所述的对象分类方法对应的操作。本申请实施例的又一方面提供了一种计算机存储介质,计算机存储介质能够存储计算机可读指令,当计算机可读指令被执行时致使处理器执行与上述训练方法对应的操作或者执行如上所述的对象分类方法对应的操作。本申请的技术方案从候选类别中下采样部分类别进行对象分类模型的训练,可用于多对象分类的对象模型的训练,简化了对象分类模型训练过程的复杂程度,降低了模型训练过程中的资源负担。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是根据本申请实施例的用于对象分类模型的训练方法的流程图;图2是根据本申请实施例的对候选类别进行下采样的方法的流程图;图3是根据本申请实施例的构建二叉树的方法的流程图;图4是根据本申请实施例的二叉树的示意性框图;图5是根据本申请实施例的二叉树构建过程的示意图;图6是根据本申请实施例的对象分类装置的框图;以及图7是根据本申请实施例的用于对象分类模型的训练系统的框图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,在本文中所描述的具体实施例仅仅用于解释本申请,而非对本申请进行限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分。下面将参照附图并结合实施例来详细说明本申请。应理解,除非另有说明,否则本文中使用的序数词,诸如“第一”、“第二”等,仅用于将一个要素与另一要素区分开,而不表示重要性或优先级。例如,第一权重和第二权重表示不同的权重。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例本文档来自技高网...
对象分类及模型训练方法、装置、介质和系统

【技术保护点】
1.一种对象分类模型的训练方法,其特征在于,所述对象分类模型包括特征提取器和分类器,所述训练方法包括:经所述特征提取器从包含对象的数据项中提取所述对象的特征;经所述分类器从预定义的候选类别集中下采样出部分类别,获取所提取的特征对于下采样出的所述部分类别的响应,以及基于所述响应对所述对象进行分类;以及根据分类的结果调整所述分类器和/或所述特征提取器中的参数。

【技术特征摘要】
1.一种对象分类模型的训练方法,其特征在于,所述对象分类模型包括特征提取器和分类器,所述训练方法包括:经所述特征提取器从包含对象的数据项中提取所述对象的特征;经所述分类器从预定义的候选类别集中下采样出部分类别,获取所提取的特征对于下采样出的所述部分类别的响应,以及基于所述响应对所述对象进行分类;以及根据分类的结果调整所述分类器和/或所述特征提取器中的参数。2.根据权利要求1所述的训练方法,其特征在于,根据分类的结果调整所述分类器中的参数包括:根据分类的结果调整所述分类器中用于对所述对象进行分类的参数。3.根据权利要求2所述的训练方法,其特征在于,经所述分类器从预定义的候选类别集中下采样出部分类别,包括:经所述分类器并根据所述分类器中用于对所述对象进行分类的参数,从预定义的候选类别集中下采样出部分类别。4.根据权利要求2或3所述的训练方法,其特征在于,根据分类的结果调整所述分类器中的参数包括:将调整参数的过程分成多个阶段,所述多个阶段中的每一阶段包括一定数量的训练循环;以及在所述每一阶段的起始时调整对所述对象进行分类时的参数。5.根据权利要求2-4任一所述的训练方法,其特征在于,所述用于对所述对象进行分类的参数包括以下至少之一:下采样的部分类别的数量、基于所述候选类别集生成的类别簇的数量、类别簇的更新周期。6.一种对象分类方法,其特征在于,包括:通过特征提取器从待处理的数据项中...

【专利技术属性】
技术研发人员:张行程杨磊林达华
申请(专利权)人:北京市商汤科技开发有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1