一种基于多模态信息融合的图像分类方法技术

技术编号:43376363 阅读:43 留言:0更新日期:2024-11-19 17:55
本申请公开了一种基于多模态信息融合的图像分类方法,涉及图像处理技术领域,该图像分类方法利用特征提取网络中的多尺度特征提取模块对每个模态的原始图像进行多尺度特征提取,多特征融合金字塔在FPN框架基础上结合空洞卷积层改进得到,可以有效地提取原始图像的上下文信息,多特征关联模块进一步增强多尺度特征关联,使得特征提取网络能得到原始图像的表征能力更强的单模态特征图,而在对两个单模态特征图进行多模态信息融合得到融合特征图后,除了使用融合特征图,还保留原始的单模态特征图一起利用分类网络进行分类,该方法可以充分挖掘模态内和模态间的图像信息,从而可以有效提升图像分类准确性和鲁棒性。

【技术实现步骤摘要】

本申请涉及图像处理,尤其是一种基于多模态信息融合的图像分类方法


技术介绍

1、图像分类是机器视觉领域的重要研究方向,这项技术通过提取图像的特征并利用机器学习模型来区分不同类别,在各个领域的多类任务中都具有广泛的应用。

2、传统经典的图像分类方法大多利用单一模态图像来实现特征提取和分类,单一模态图像的特征表征能力差且信息表达有限,这导致基于单一模态图像的图像分类的准确度和精度不够理想。为了解决上述问题,对多模态图像信息融合后进行图像分类的做法逐渐被应用于各领域的分类任务中,由于不同模态的图像能够提供不同的图像信息,因此这种做法能够实现不同模态的图像信息之间的互补,相比于使用单一模态图像的图像分类方法能够提高分类的准确度和精度。但是现有的基于多模态信息融合的图像分类方法存在对多模态图像信息利用不充分的问题,没有充分挖掘图像信息,导致基于多模态信息融合的图像分类的准确度和精度仍然难以达到令人满意的效果,尤其是在一些图像质量不高的场景下更是难以保证分类性能。


技术实现思路

1、本申请针对上述问题及技术需本文档来自技高网...

【技术保护点】

1.一种基于多模态信息融合的图像分类方法,其特征在于,所述图像分类方法包括:

2.根据权利要求1所述的图像分类方法,其特征在于,所述多特征融合金字塔包括K个依次相连的空洞卷积层,沿着连接方向的第一个空洞卷积层至第K个空洞卷积层的卷积核尺寸依次增大,沿着连接方向的前K-1个空洞卷积层的输出端分别连接一个上采样层的输入端;

3.根据权利要求2所述的图像分类方法,其特征在于,在所述多特征融合金字塔中,每个上采样层的输入端及其连接的空洞卷积层之间还连接有频率通道注意力机制层。

4.根据权利要求1所述的图像分类方法,其特征在于,所述多特征关联模块包括融合层、分割...

【技术特征摘要】

1.一种基于多模态信息融合的图像分类方法,其特征在于,所述图像分类方法包括:

2.根据权利要求1所述的图像分类方法,其特征在于,所述多特征融合金字塔包括k个依次相连的空洞卷积层,沿着连接方向的第一个空洞卷积层至第k个空洞卷积层的卷积核尺寸依次增大,沿着连接方向的前k-1个空洞卷积层的输出端分别连接一个上采样层的输入端;

3.根据权利要求2所述的图像分类方法,其特征在于,在所述多特征融合金字塔中,每个上采样层的输入端及其连接的空洞卷积层之间还连接有频率通道注意力机制层。

4.根据权利要求1所述的图像分类方法,其特征在于,所述多特征关联模块包括融合层、分割层和增强层,输入所述多特征关联模块的k个中间特征图分别输入到所述融合层和所述增强层;

5.根据权利要求4所述的图像分类方法,其特征在于,在所述多特征关联模块中,所述增强层将平均分割操作得到的每个分割...

【专利技术属性】
技术研发人员:房峰张旭匡昌武刘丽莹浦凯文郑峰宫泽周望陈希
申请(专利权)人:航天新气象科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1