一种图像分类模型的处理方法、装置及存储介质制造方法及图纸

技术编号：19635686 阅读：17 留言：0更新日期：2018-12-01 16:19

本发明专利技术公开了一种图像分类模型的处理方法，所述方法包括：分别对原始空间中的源域图像样本集和目标域图像样本集进行降维，对应得到源域子空间和目标域子空间；将所述源域子空间和所述目标域子空间中的样本对齐，确定源域与目标域之间的分布差异化满足预设最小差异条件时的降维后的源域图像样本；对所述降维后的源域图像样本中各类别样本进行加权处理，得到对齐加权后的源域图像样本；将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型。本发明专利技术还同时公开了一种图像分类模型的处理装置、以及存储介质。

Processing method, device and storage medium of an image classification model

The invention discloses a method for processing an image classification model. The method includes: reducing the dimension of the source domain image sample set and the target domain image sample set in the original space respectively, corresponding to the source domain subspace and the target domain subspace; aligning the source domain subspace with the sample in the target domain subspace to ensure the accuracy. Distribution differentiation between localized and target domains satisfies the preset minimum difference condition of the reduced source domain image samples; weights the various types of samples in the reduced source domain image samples to obtain the aligned weighted source domain image samples; and aligns the aligned weighted source domain image samples and the corresponding source domain image samples. The tag is applied to a model for classifying new image samples in the target domain. The invention also discloses a processing device for image classification model and a storage medium.

全部详细技术资料下载

【技术实现步骤摘要】
一种图像分类模型的处理方法、装置及存储介质
本专利技术涉及计算机领域中的图像识别技术，尤其涉及一种图像分类模型的处理方法、装置及存储介质。
技术介绍
目前，在常规机器学习中有一个重要假设，即源域的样本数据(也称为训练数据)和目标域的样本数据(也称为测试数据)具有相同的分布。然而在很多实际应用中，这一假设往往是不成立的。因此，应用传统的图像识别方法训练出的图像分类模型的识别效果远不能达到人们的期望。实际上，当源域的样本数据与目标域的样本数据不能满足独立同分布的条件时，可以采用领域自适应方法如非监督领域自适应方法对图像样本进行分类。相关技术中，常用的领域自适应方法包括测地流方法和子空间对齐(SA，SubspaceAlignment)方法。然而，利用测地流方法对图像样本进行分类时，存在以下缺陷：1)需要计算大量的中间子空间，导致算法复杂度很高；2)最终得到的最优解是局部最优解，而不是全局最优解。相比于测地流方法，SA方法虽然在样本识别准确率方面有所提高，但仍存在如下不足：该方法假设源域中所有图像样本的地位相同，即对源域中所有图像样本进行同等对待，然而在实际情景中，经常会出现源域图像样本与目标域图像样本的类别不平衡的现象。如图1所示，图1(a)为源域图像样本中的各类别图像的示意图，图1(b)为目标域图像样本中的各类别图像的示意图，通过对比图1(a)和图1(b)可见，源域和目标域中每类样本对应的数目，比如源域图像样本中的三角形个数与目标域图像样本中的三角形个数不均衡，从而导致图像识别准确度降低，使得模型训练学习的效果无法达到预期结果。因此，对于如何克服由于源域图像样...

【技术保护点】
1.一种图像分类模型的处理方法，其特征在于，所述方法包括：分别对原始空间中的源域图像样本集和目标域图像样本集进行降维，对应得到源域子空间和目标域子空间；将所述源域子空间和所述目标域子空间中的样本对齐，确定源域与目标域之间的分布差异化满足预设最小差异条件时的降维后的源域图像样本；对所述降维后的源域图像样本中各类别样本进行加权处理，得到对齐加权后的源域图像样本；将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型。

【技术特征摘要】
1.一种图像分类模型的处理方法，其特征在于，所述方法包括：分别对原始空间中的源域图像样本集和目标域图像样本集进行降维，对应得到源域子空间和目标域子空间；将所述源域子空间和所述目标域子空间中的样本对齐，确定源域与目标域之间的分布差异化满足预设最小差异条件时的降维后的源域图像样本；对所述降维后的源域图像样本中各类别样本进行加权处理，得到对齐加权后的源域图像样本；将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型。2.根据权利要求1所述的图像分类模型的处理方法，其特征在于，在所述将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型之前，所述方法还包括：对所述目标域中新图像样本进行降维，得到降维后的目标域新图像样本；所述将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型，包括：将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述降维后的目标域新图像样本进行分类的模型。3.根据权利要求1所述的图像分类模型的处理方法，其特征在于，所述对原始空间中的源域图像样本集和目标域图像样本集进行降维，对应得到源域子空间和目标域子空间，包括：确定所述源域图像样本集在第一投影空间对应的第一投影矩阵，以及确定所述目标域图像样本集在第二投影空间对应的第二投影矩阵；基于所述第一投影矩阵，从所述源域图像样本集中提取预设维数的第一图像特征，根据所述预设维数的第一图像特征确定所述源域子空间；基于所述第二投影矩阵，从所述目标域图像样本集中提取所述预设维数的第二图像特征，根据所述预设维数的第二图像特征确定所述目标域子空间；其中，所述预设维数小于提取图像特征前对应的维数。4.根据权利要求1所述的图像分类模型的处理方法，其特征在于，在所述将所述源域子空间和所述目标域子空间中的样本对齐之前，所述方法还包括：确定初始化的对齐矩阵和初始化的权重矩阵；构建以所述源域子空间、所述目标域子空间、所述初始化的对齐矩阵以及所述初始化的权重矩阵为因子的目标函数；确定所述目标函数满足第一收敛条件时的更新对齐矩阵；所述将所述源域子空间和所述目标域子空间中的样本对齐，包括：根据所述更新对齐矩阵，将所述源域子空间和所述目标域子空间中的样本对齐。5.根据权利要求4所述的图像分类模...

【专利技术属性】
技术研发人员：许明微，李琳，吴耀华，
申请(专利权)人：咪咕文化科技有限公司，中国移动通信集团有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人