一种图像分类模型的处理方法、装置及存储介质制造方法及图纸

技术编号:19635686 阅读:17 留言:0更新日期:2018-12-01 16:19
本发明专利技术公开了一种图像分类模型的处理方法,所述方法包括:分别对原始空间中的源域图像样本集和目标域图像样本集进行降维,对应得到源域子空间和目标域子空间;将所述源域子空间和所述目标域子空间中的样本对齐,确定源域与目标域之间的分布差异化满足预设最小差异条件时的降维后的源域图像样本;对所述降维后的源域图像样本中各类别样本进行加权处理,得到对齐加权后的源域图像样本;将所述对齐加权后的源域图像样本以及对应的标签,应用于对所述目标域中新图像样本进行分类的模型。本发明专利技术还同时公开了一种图像分类模型的处理装置、以及存储介质。

Processing method, device and storage medium of an image classification model

The invention discloses a method for processing an image classification model. The method includes: reducing the dimension of the source domain image sample set and the target domain image sample set in the original space respectively, corresponding to the source domain subspace and the target domain subspace; aligning the source domain subspace with the sample in the target domain subspace to ensure the accuracy. Distribution differentiation between localized and target domains satisfies the preset minimum difference condition of the reduced source domain image samples; weights the various types of samples in the reduced source domain image samples to obtain the aligned weighted source domain image samples; and aligns the aligned weighted source domain image samples and the corresponding source domain image samples. The tag is applied to a model for classifying new image samples in the target domain. The invention also discloses a processing device for image classification model and a storage medium.

【技术实现步骤摘要】
一种图像分类模型的处理方法、装置及存储介质
本专利技术涉及计算机领域中的图像识别技术,尤其涉及一种图像分类模型的处理方法、装置及存储介质。
技术介绍
目前,在常规机器学习中有一个重要假设,即源域的样本数据(也称为训练数据)和目标域的样本数据(也称为测试数据)具有相同的分布。然而在很多实际应用中,这一假设往往是不成立的。因此,应用传统的图像识别方法训练出的图像分类模型的识别效果远不能达到人们的期望。实际上,当源域的样本数据与目标域的样本数据不能满足独立同分布的条件时,可以采用领域自适应方法如非监督领域自适应方法对图像样本进行分类。相关技术中,常用的领域自适应方法包括测地流方法和子空间对齐(SA,SubspaceAlignment)方法。然而,利用测地流方法对图像样本进行分类时,存在以下缺陷:1)需要计算大量的中间子空间,导致算法复杂度很高;2)最终得到的最优解是局部最优解,而不是全局最优解。相比于测地流方法,SA方法虽然在样本识别准确率方面有所提高,但仍存在如下不足:该方法假设源域中所有图像样本的地位相同,即对源域中所有图像样本进行同等对待,然而在实际情景中,经常会出现源域图像样本与目标域图像样本的类别不平衡的现象。如图1所示,图1(a)为源域图像样本中的各类别图像的示意图,图1(b)为目标域图像样本中的各类别图像的示意图,通过对比图1(a)和图1(b)可见,源域和目标域中每类样本对应的数目,比如源域图像样本中的三角形个数与目标域图像样本中的三角形个数不均衡,从而导致图像识别准确度降低,使得模型训练学习的效果无法达到预期结果。因此,对于如何克服由于源域图像样本的类别与目标域图像样本的类别不平衡而影响图像分类模型准确度的问题,相关技术尚未提出有效解决方案。
技术实现思路
有鉴于此,本专利技术实施例期望提供一种图像分类模型的处理方法、装置及存储介质,至少用以解决相关技术中由于源域图像样本的类别与目标域图像样本的类别不平衡而降低图像分类模型准确度的问题。为达到上述目的,本专利技术实施例的技术方案是这样实现的:第一方面,本专利技术实施例提供一种图像分类模型的处理方法,所述方法包括:分别对原始空间中的源域图像样本集和目标域图像样本集进行降维,对应得到源域子空间和目标域子空间;将所述源域子空间和所述目标域子空间中的样本对齐,确定源域与目标域之间的分布差异化满足预设最小差异条件时的降维后的源域图像样本;对所述降维后的源域图像样本中各类别样本进行加权处理,得到对齐加权后的源域图像样本;将所述对齐加权后的源域图像样本以及对应的标签,应用于对所述目标域中新图像样本进行分类的模型。第二方面,本专利技术实施例还提供一种图像分类模型的处理装置,所述装置包括:降维模块、对齐模块、加权模块和应用模块;其中,所述降维模块,用于分别对原始空间中的源域图像样本集和目标域图像样本集进行降维,对应得到源域子空间和目标域子空间;所述对齐模块,用于将所述源域子空间和所述目标域子空间中的样本对齐,确定源域与目标域之间的分布差异化满足预设最小差异条件时的降维后的源域图像样本;所述加权模块,用于对所述降维后的源域图像样本中各类别样本进行加权处理,得到对齐加权后的源域图像样本;所述应用模块,用于将所述对齐加权后的源域图像样本以及对应的标签,应用于对所述目标域中新图像样本进行分类的模型。第三方面,本专利技术实施例还提供一种存储介质,其上存储有可执行程序,所述可执行程序被处理器执行时实现本专利技术实施例提供的图像分类模型的处理方法的步骤。第四方面,本专利技术实施例还提供一种图像分类模型的处理装置,包括存储器、处理器及存储在存储器上并能够由所述处理器运行的可执行程序,所述处理器运行所述可执行程序时执行本专利技术实施例提供的图像分类模型的处理方法的步骤。本专利技术实施例所提供的图像分类模型的处理方法、装置及存储介质,通过对原始空间中的源域图像样本集和目标域图像样本集进行降维,对应得到源域子空间和目标域子空间,将源域子空间和目标域子空间中的样本进行对齐,确定源域与目标域之间的分布差异化满足预设最小差异条件时的降维后的源域图像样本,并对所述降维后的源域图像样本中各类别样本进行加权处理,以得到对齐加权后的源域图像样本;最后,将所述对齐加权后的源域图像样本以及对应的标签,应用于对所述目标域中新图像样本进行分类的模型。如此,在对齐源域子空间和目标域子空间中的样本之后,对降维后的源域图像样本中各类别样本进行加权处理,可以减小因源域图像样本的类别与目标域图像样本的类别不平衡而对图像分类模型的准确度所带来的影响;并且,采用上述构建的图像分类模型对待识别的目标域新图像样本进行分类识别,使得训练的分类器可以更加的鲁棒,能够得到很好的识别结果,从而大大提高图像识别的准确度,提升用户使用体验。附图说明图1(a)为源域图像样本中的各类别图像的示意图;图1(b)为目标域图像样本中的各类别图像的示意图;图2本专利技术实施例提供的图像分类模型的处理方法的一个可选的实现流程示意图;图3为本专利技术实施例提供的图像分类模型的处理方法的另一个可选的实现流程示意图;图4为本专利技术实施例提供的图像分类模型的处理装置的一个可选的功能结构示意图;图5为本专利技术实施例提供的图像分类模型的处理装置的另一个可选的功能结构示意图;图6为本专利技术实施例提供的图像分类模型的处理装置的一个可选的硬件结构示意图。具体实施方式为了能够更加详尽地了解本专利技术实施例的特点与
技术实现思路
,下面结合附图对本专利技术实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本专利技术。图2为本专利技术实施例提供的图像分类模型的处理方法的一个可选的实现流程示意图,所述图像分类模型的处理方法可应用于服务器或终端设备中;如图2所示,本专利技术实施例中的图像分类模型的处理方法的实现流程,可以包括以下步骤:步骤201:分别对原始空间中的源域图像样本集和目标域图像样本集进行降维,对应得到源域子空间和目标域子空间。本专利技术实施例中,可选地,采用主成分分析(PCA,PrincipalComponentsAnalysis)方法对原始空间中的源域图像样本集和目标域图像样本集进行降维。PCA是一种分析、简化数据集的技术,主要用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。对于原始空间中的源域图像样本集和目标域图像样本集来说,利用PCA方法保留源域图像样本集和目标域图像样本集中的低阶主成分,忽略源域图像样本集和目标域图像样本集中的高阶主成分,而这里所保留的低阶主成分能够体现源域图像样本集和目标域图像样本集中的重要图像特征,而忽略的高阶主成分一般不包括重要图像特征,因此,即使忽略了源域图像样本集和目标域图像样本集中的高阶主成分也不会影响到图像的整体效果。这样,通过降维操作可以去除图像中冗余的图像特征和噪声。这里,对源域图像样本集和目标域图像样本集中的高阶主成分进行降维的过程,主要是将原始空间中的高维图像特征投影到较低维的特征空间中,从较低维的特征空间中分离出能够体现源域图像样本和目标域图像样本中的关键图像特征。在本专利技术实施例中,对于本步骤201中的对原始空间中的源域图像样本集和目标域图像样本集进行降维,对应得到源域子空间和目标域子空间的具体过程可以包括:确定所述源域图像样本集在第一投影空间对应的第一投影矩阵本文档来自技高网
...

【技术保护点】
1.一种图像分类模型的处理方法,其特征在于,所述方法包括:分别对原始空间中的源域图像样本集和目标域图像样本集进行降维,对应得到源域子空间和目标域子空间;将所述源域子空间和所述目标域子空间中的样本对齐,确定源域与目标域之间的分布差异化满足预设最小差异条件时的降维后的源域图像样本;对所述降维后的源域图像样本中各类别样本进行加权处理,得到对齐加权后的源域图像样本;将所述对齐加权后的源域图像样本以及对应的标签,应用于对所述目标域中新图像样本进行分类的模型。

【技术特征摘要】
1.一种图像分类模型的处理方法,其特征在于,所述方法包括:分别对原始空间中的源域图像样本集和目标域图像样本集进行降维,对应得到源域子空间和目标域子空间;将所述源域子空间和所述目标域子空间中的样本对齐,确定源域与目标域之间的分布差异化满足预设最小差异条件时的降维后的源域图像样本;对所述降维后的源域图像样本中各类别样本进行加权处理,得到对齐加权后的源域图像样本;将所述对齐加权后的源域图像样本以及对应的标签,应用于对所述目标域中新图像样本进行分类的模型。2.根据权利要求1所述的图像分类模型的处理方法,其特征在于,在所述将所述对齐加权后的源域图像样本以及对应的标签,应用于对所述目标域中新图像样本进行分类的模型之前,所述方法还包括:对所述目标域中新图像样本进行降维,得到降维后的目标域新图像样本;所述将所述对齐加权后的源域图像样本以及对应的标签,应用于对所述目标域中新图像样本进行分类的模型,包括:将所述对齐加权后的源域图像样本以及对应的标签,应用于对所述降维后的目标域新图像样本进行分类的模型。3.根据权利要求1所述的图像分类模型的处理方法,其特征在于,所述对原始空间中的源域图像样本集和目标域图像样本集进行降维,对应得到源域子空间和目标域子空间,包括:确定所述源域图像样本集在第一投影空间对应的第一投影矩阵,以及确定所述目标域图像样本集在第二投影空间对应的第二投影矩阵;基于所述第一投影矩阵,从所述源域图像样本集中提取预设维数的第一图像特征,根据所述预设维数的第一图像特征确定所述源域子空间;基于所述第二投影矩阵,从所述目标域图像样本集中提取所述预设维数的第二图像特征,根据所述预设维数的第二图像特征确定所述目标域子空间;其中,所述预设维数小于提取图像特征前对应的维数。4.根据权利要求1所述的图像分类模型的处理方法,其特征在于,在所述将所述源域子空间和所述目标域子空间中的样本对齐之前,所述方法还包括:确定初始化的对齐矩阵和初始化的权重矩阵;构建以所述源域子空间、所述目标域子空间、所述初始化的对齐矩阵以及所述初始化的权重矩阵为因子的目标函数;确定所述目标函数满足第一收敛条件时的更新对齐矩阵;所述将所述源域子空间和所述目标域子空间中的样本对齐,包括:根据所述更新对齐矩阵,将所述源域子空间和所述目标域子空间中的样本对齐。5.根据权利要求4所述的图像分类模...

【专利技术属性】
技术研发人员:许明微李琳吴耀华
申请(专利权)人:咪咕文化科技有限公司中国移动通信集团有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1