【技术实现步骤摘要】
训练分类器的方法和装置
本申请涉及人工智能领域,尤其涉及一种训练分类器的方法和装置。
技术介绍
神经网络是实现人工智能的工具,神经网络在应用前需要经过大量样本的训练才能实现特定的功能,当需要神经网络实现新的功能时,通常还需要使用大量新样本训练神经网络。一种减小再次训练神经网络的工作量的方法是知识迁移。神经网络基于大量样本完成训练后,学习到了知识;当使用新(novel)样本训练神经网络时,可以利用已经学习到的知识处理新样本,这样可以较少的新样本完成神经网络的再次训练,提升神经网络的性能。相比于新样本,上述大量样本可以称为基础(base)样本,在利用知识迁移和新样本训练神经网络时,通常利用特征提取器从新样本中提取特征,并基于特征对新样本进行分类等处理,当新样本的类别改变时,特征提取器需要重新学习新类别的新样本的特征,导致训练工作量增大。
技术实现思路
本申请提供了一种训练分类器的方法和装置,能够分类器的训练效率和性能。第一方面,提供了一种训练分类器的方法,包括:获取第一训练样本,所述第 ...
【技术保护点】
1.一种训练分类器的方法,其特征在于,包括:/n获取第一训练样本,所述第一训练样本包括相应的语义标签;/n获取多个第二训练样本,每个所述第二训练样本包括相应的语义标签;/n根据所述第一训练样本和所述多个第二训练样本的语义相似度从所述多个第二训练样本中确定目标样本;/n根据所述第一训练样本、所述目标样本、所述第一训练样本和所述目标样本的语义相似度训练分类器。/n
【技术特征摘要】
1.一种训练分类器的方法,其特征在于,包括:
获取第一训练样本,所述第一训练样本包括相应的语义标签;
获取多个第二训练样本,每个所述第二训练样本包括相应的语义标签;
根据所述第一训练样本和所述多个第二训练样本的语义相似度从所述多个第二训练样本中确定目标样本;
根据所述第一训练样本、所述目标样本、所述第一训练样本和所述目标样本的语义相似度训练分类器。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一训练样本、所述目标样本、所述第一训练样本和所述目标样本的语义相似度训练分类器,包括:
通过所述分类器确定所述第一训练样本的预测得分;
根据所述预测得分、所述第一训练样本与所述目标样本的语义相似度确定所述分类器的语义迁移损失函数Lsemantic,所述目标样本与所述第一训练样本的语义相似度用于确定所述预测得分对所述Lsemantic的影响程度;
根据所述Lsemantic训练所述分类器。
3.根据权利要求2所述的方法,其特征在于,
当所述目标样本与所述第一训练样本的语义相似度大于等于语义迁移强度时,所述预测得分对所述Lsemantic的影响程度为100%;
当所述目标样本与所述第一训练样本的语义相似度小于所述语义迁移强度时,所述预测得分对所述Lsemantic的影响程度为0。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述根据所述第一训练样本、所述目标样本、所述第一训练样本和所述目标样本的语义相似度训练分类器,包括:
通过所述分类器确定所述第一训练样本的预测得分Sn;
通过所述分类器确定所述目标训练样本的预测得分Sb;
根据所述Sn、所述Sb和平衡性学习强度确定所述分类器的平衡性学习损失函数LIC,所述平衡性学习强度用于调整所述Sn和所述Sb对所述LIC的影响程度;
根据所述LIC训练所述分类器。
5.根据权利要求4所述的方法,其特征在于,所述平衡性学习强度用于调整所述Sn和所述Sb对所述LIC的影响程度,包括:
所述平衡性学习强度用于增大所述Sn对所述LIC的影响程度,以及减小所述Sb对所述LIC的影响程度。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述根据所述第一训练样本、所述目标样本、所述第一训练样本和所述目标样本的语义相似度训练分类器,包括:
获取所述第一训练样本和所述目标样本的多视角特征;
根据所述多视角特征训练所述分类器。
7.根据权利要求6所述的方法,其特征在于,所述获取所述第一训练样本和所述目标样本的多视角特征,包括:
从所述第一训练样本和所述目标样本中的每个样本中分离出多个图像,所述每个样本的多个图像的视角互不相同;
根据所述每个样本的多个图像获取所述每个样本的多个特征;
拼接所述每个样本的所述多个特征得到所述多视角特征。
8.根据权利要求1至7中任一项所述的方法,其特征在于,所述根据所述第一训练样本、所述目标样本、所述第一训练样本和所述目标样本的语义相似度训练分类器,包括:
通过所述分类器确定所述第一训练样本的预测得分;
根据所述预测得分确定所述分类器的分类损失函数LCE;
根据所述LCE训练所述分类器。
9.一种图像分类方法,其特征在于,包括:
获取待分类图像的特征;
将所述特征输入神经网络进行分类,所述神经网络包括分类器,所述分类器是通过第一训练样本、所述第一训练样本对应的目标样本、所述第一训练样本和所述目标样本的语义相似度训练得到的,所述目标样本是根据所述第一训练样本和多个第二训练样本的语义相似度从所述多个第二训练样本中确定的;
获取所述待分类图像的分类结果。
10.根据权利要求9所述的方法,其特征在于,所述带分类图像的特征为多视角特征。
11.根据权利要求10所述的方法,其特征在于,所述获取待分类图像的特征,包括:
从所述待分类图像中获取多个不同视角的图像;
获取所述多个不同视角的图像中每个图像的特征;
拼接所述每个图像的特征得到所述待分类图像的多视角特征。
12.根据权利要求9至11中任一项所述的方法,其特征在于,所述分类器是通过第一训练样本、所述第一训练样本对应的目标样本、所述第一训练样本和所述目标样本的语义相似度训练得到的,包括:
通过所述分类器确定所述第一训练样本的预测得分;
根据所述预测得分、...
【专利技术属性】
技术研发人员:王硕,岳俊,刘健庄,田奇,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。