【技术实现步骤摘要】
基于多尺度反复注意力机制的细粒度图像分类方法
本专利技术涉及图像分类任务中的细粒度图像分类领域,细粒度图像分类是对某一类别下的图像子类进行精确划分。细粒度图像分类以其“特征相似,姿态各异,背景干扰”等特点,一直是计算机视觉和模式识别领域的研究热点和难点,具有重要的研究价值。尤其涉及一种基于多尺度反复注意力机制的细粒度图像分类方法。
技术介绍
鉴于传统算法对细粒度图像分类准确率低,模型泛化能力差,基于深度学习实现细粒度图像分类逐渐成为当前的主流,主要可分为:强监督算法和弱监督算法2大类。其中,强监督算法需要基于人工标注特征完成,利用人工标注好的信息对待分类目标的判别性区域进行精确定位,可以大大减少运算时间,但是由于强监督算法成本较高,对显著性特征提取能力不足,不能满足实际工程的需要,与之相比,弱监督算法生成的特征矩阵具有更好的表现力。细粒度图像分类的难点在于:训练样本的分类数目较多,但每个类别下的样本数目太少,容易导致过拟合;网络模型复杂,参数量较多,对计算机要求较高;同一类别下的样本受光照,姿态等影响差异较大,使得网 ...
【技术保护点】
1.一种基于多尺度反复注意力机制的细粒度图像分类方法,其特征在于,所述方法包括:/n对训练数据集进行随机裁剪,水平翻转来增强数据集,防止过拟合;/n在ResNet50模型的基础上以多尺度的方式,引入反复注意力机制;/n输入训练样本,将训练样本统一输入大小为448*448,使用多尺度的反复注意力模型作为特征提取器,将不同尺度得到的特征矩阵进行拼接,送入全连接层和softmax进行分类训练;/n保存最终的训练模型,在测试集上进行测试,得到最终的准确率。/n
【技术特征摘要】
1.一种基于多尺度反复注意力机制的细粒度图像分类方法,其特征在于,所述方法包括:
对训练数据集进行随机裁剪,水平翻转来增强数据集,防止过拟合;
在ResNet50模型的基础上以多尺度的方式,引入反复注意力机制;
输入训练样本,将训练样本统一输入大小为448*448,使用多尺度的反复注意力模型作为特征提取器,将不同尺度得到的特征矩阵进行拼接,送入全连接层和softmax进行分类训练;
保存最终的训练模型,在测试集上进行测试,得到最终的准确率。
2.根据权利要求1所述的一种基于多尺度反复注意力机制的细粒度图像分类方法,其特征在于,所述反复注意力机制具体为:
先将某一层级的特征矩阵X,并行经过通道和空间注意力支路,分别得到通道和空间权重矩阵;再将特征矩阵X与通道权重矩阵相乘,对输入图像的不同特征图进行权重赋值;
再与空间权重矩阵相乘,以去除无关背景的干扰;最后以残差的方式,将注意力结果与输入特征X结合。
3.根据权利...
【专利技术属性】
技术研发人员:何凯,冯旭,高圣楠,马希涛,
申请(专利权)人:天津大学,
类型:发明
国别省市:天津;12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。