一种基于金字塔池化图神经网络的目标检测方法技术

技术编号:41714528 阅读:28 留言:0更新日期:2024-06-19 12:42
本发明专利技术涉及一种基于金字塔池化图神经网络的目标检测方法,通过将待检测目标图像输入训练完成的目标检测模型中得到目标检测结果,其中,目标检测模型对输入图像执行以下步骤:将输入图像进行预处理划分为多个块;将划分的块重塑到二维空间,进行平均池化得到金字塔池化特征图;对金字塔池化特征图进行相对位置编码;将金字塔池化特征图作为节点,构建邻接矩阵,形成图结构;利用图结构,基于本地的图神经网络融合金字塔池化特征,得到图级别表示;利用图级别表示,基于全局多头自注意力网络提取全局的特征信息;利用提取到的特征信息,基于卷积神经网络进行目标检测,输出目标检测框及其对应的类别概率。与现有技术相比,本发明专利技术具有更精细的特征表达、提高了模型鲁棒性和泛化能力等优点。

【技术实现步骤摘要】

本专利技术涉及图像处理,尤其是涉及一种基于金字塔池化图神经网络的目标检测方法


技术介绍

1、在过去的十年里,卷积神经网络(cnn)凭借其卓越的局部特征抽取能力和层级表示学习能力,在计算机视觉领域确立了无可替代的地位。以vgg、resnet、densenet等为代表的深度神经网络架构不仅深刻改变了图像分类任务的格局,还广泛渗透到了语义分割、目标检测、图像识别等众多视觉任务中,不断刷新着各项基准测试的成绩,并有力推动了整个计算机视觉领域的技术进步与发展。

2、近年来,随着transformer架构在自然语言处理领域的巨大成功,科研人员开始探索将其应用于计算机视觉任务的可能性。vision transformer(vit)的出现标志着这一转折点的到来,它成功地将transformer的核心思想引入到视觉领域,并在多项视觉任务上展现出超越先进cnn模型的优越性能。自此以后,视觉transformer的研究热潮席卷而来,一系列视觉transformer模型如雨后春笋般涌现,包括但不限于vit、deit、detr等,它们分别从网络架构设计、位置编码机制、本文档来自技高网...

【技术保护点】

1.一种基于金字塔池化图神经网络的目标检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于金字塔池化图神经网络的目标检测方法,其特征在于,所述步骤S1具体为:对于给定的输入图像H×W×3,将其划分成个块,每个块的大小为4×4×3,其中,H表示图像的高度,W表示图像的宽度。

3.根据权利要求1所述的一种基于金字塔池化图神经网络的目标检测方法,其特征在于,所述步骤S2具体为:在图像预处理操作之后,将得到的块重塑到二维空间,重塑后的块大小用X表示,使用多个不同比率的平均池化层来形成金字塔池化特征图:

4.根据权利要求3所述的一种基于金字塔池...

【技术特征摘要】

1.一种基于金字塔池化图神经网络的目标检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于金字塔池化图神经网络的目标检测方法,其特征在于,所述步骤s1具体为:对于给定的输入图像h×w×3,将其划分成个块,每个块的大小为4×4×3,其中,h表示图像的高度,w表示图像的宽度。

3.根据权利要求1所述的一种基于金字塔池化图神经网络的目标检测方法,其特征在于,所述步骤s2具体为:在图像预处理操作之后,将得到的块重塑到二维空间,重塑后的块大小用x表示,使用多个不同比率的平均池化层来形成金字塔池化特征图:

4.根据权利要求3所述的一种基于金字塔池化图神经网络的目标检测方法,其特征在于,所述步骤s3具体为:将金字塔池化特征图输入一个3x3的深度卷积中进行相对位置编码:

5.根据权利要求4所述的一种基于金字塔池化图神经网络的目标检测方法,其特征在于,所述步骤s4包括以下步骤:

6.根据权利要求5所述的一种基于金字塔池化图神经网络的目标检测方法,其特征在于,所述将每个节点的特征维度映射到相同维度具体为:<...

【专利技术属性】
技术研发人员:李志鹏黄德双王思果张钦虎
申请(专利权)人:宁波东方理工大学暂名
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1