当前位置: 首页 > 专利查询>之江实验室专利>正文

基于混合批归一化的长尾学习图像分类、训练方法及装置制造方法及图纸

技术编号:34433383 阅读:20 留言:0更新日期:2022-08-06 16:13
本发明专利技术公开了基于混合批归一化的长尾学习图像分类、训练方法及装置,训练方法通过构建混合标准化分支和分裂标准化分支,得到对应标准化后的特征向量,再通过双分支学习框架,将经强增强和弱增强的样本图像输入标准化分支后,进行图像分类,通过分类结果计算两个分支分类预测的相似性最大化损失以及用平衡交叉熵损失来计算分类损失,优化双分支框架对应的网络参数。混合标准化分支能够更全面地对特征空间进行建模,减轻头部类的主导地位,分裂标准化分支能够多样化估计的高斯分布,使高斯分布更全面地拟合尾部类别的训练样,图像分类方法及装置则是利用训练好的混合标准化分支进行图像分类。进行图像分类。进行图像分类。

【技术实现步骤摘要】
基于混合批归一化的长尾学习图像分类、训练方法及装置


[0001]本专利技术涉及图像分类领域,尤其是涉及基于混合批归一化的长尾学习图像分类、训练方法及装置。

技术介绍

[0002]近年来,不平衡学习问题吸引了广泛的研究兴趣。然而,现有的方法无法在不妨碍头部类的性能或保持有效框架的情况下获得尾部类的高精度。本专利技术的目标是利用长尾训练数据进行学习,同时避免了上述问题。在使用长尾样本学习深度卷积神经网络(CNNs)时,网络参数的优化以头部类样本为主导,导致尾部类样本的性能相对较低,在图像分类领域,最终将会影响图像分类的精度。数据不平衡问题的传统解决方案是使优化过程偏向于较不频繁的类。批量标准化是在CNNs的前馈计算过程中,减少内部协变量偏移的一个关键组成部分。它可以加快网络参数的优化速度,提高泛化能力。但是,在图像数据分类识别中,在头部类样本(图像数据中经常出现的通用类别)和尾部类样本(图像数据中较少出现的稀有类别)不平衡的情况下,如图1a所示,利用单模态高斯概率函数不能完全对特征空间进行建模,容易忽略尾部类的样本。因此,传统的批标准化只能消除全局本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于混合批归一化的长尾学习图像分类训练方法,其特征在于包括如下步骤:步骤S1:构建混合标准化分支,利用混合批归一化,采用M个高斯分布,标准化输入的当前批次样本图像的特征向量,通过学习单独的比例系数和偏差系数,重新分配不同的归一化分支的批次特征向量,采用期望最大化算法,更新M个高斯分布的参数;步骤S2:构建分裂标准化分支,采用分裂特征标准化,将作为训练数据的样本图像的特征向量,分成M个独立的组,利用不同组的特征,计算分裂阶段当前批次高斯分布的参数,并结合混合批归一化更新的高斯分布的参数,累计更新M个组高斯分布的参数,通过单独的比例系数和偏差系数,重新分配不同的高斯分布标准化分支的特征向量;步骤S3:构建双分支学习框架,对混合标准化分支和分裂标准化分支的输入样本图像,均进行强增强和弱增强,通过得到的特征向量进行图像分类,计算两个分支分类预测的相似性最大化损失以及分类损失,优化双分支对应的图像分类神经网络参数。2.根据权利要求1所述的基于混合批归一化的长尾学习图像分类训练方法,其特征在于:所述步骤S1包括如下步骤:步骤S1.1:对当前批次样本图像的特征图进行标准化,得到混合阶段标准化特征图;步骤S1.2:采用期望最大化算法,对当前批次样本图像的特征图和M组高斯分布的参数,计算混合阶段当前批次M组高斯分布的参数;步骤S1.3:采用期望最大化算法,混合阶段各组的高斯分布的参数,累计更新M个高斯分布的参数,采用单独的比例系数和偏差系数,重新分配不同的高斯分布标准化分支的特征向量。3.根据权利要求2所述的基于混合批归一化的长尾学习图像分类训练方法,其特征在于:所述高斯分布的参数包括高斯分布的先验概率、均值和方差;步骤S1.1中,通过高斯分布的均值和方差,对当前批次样本图像的特征图进行标准化;步骤S1.2中,高斯分布的参数包括先验概率、均值和方差,首先对当前批次样本图像的特征图、均值和方差,通过期望最大化算法,得到高斯概率密度,然后通过高斯概率密度和先验概率,计算当前批次样本图像的特征图属于某一组高斯分布的概率值,最后通过概率值和批归一化的大小,计算混合阶段的先验概率,通过概率值、批归一化的大小和当前批次样本图像的特征图,计算混合阶段的均值,通过概率值、批归一化的大小、当前批次样本图像的特征图和混合阶段的均值,计算混合阶段的方差;步骤S1.3中,高斯分布的先验概率、均值和方差,结合对应的混合阶段高斯分布的先验概率、均值和方差,通过比例系数进行更新,得到混合阶段更新后的高斯分布先验概率、均值和方差;混合阶段标准化特征图,经其对应的偏差系数调整后,结合相应的所述概率值,通过累加得到混合阶段高斯分布标准化分支的特征向量。4.根据权利要求1所述的基于混合批归一化的长尾学习图像分类训练方法,其特征在于:所述步骤S2中,将训练数据分成相互独立的M组,输入的特征向量也相应的划分为M组,包括如下步骤:步骤S2.1:通过混合阶段更新后的高斯分布参数,对相应组的样本图像的特征图进行标准化,得到分裂阶段标准化特征图;步骤S2...

【专利技术属性】
技术研发人员:程乐超方超伟李根
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1