一种基于多尺度特征聚合的视觉地点识别方法技术

技术编号:41358254 阅读:14 留言:0更新日期:2024-05-20 10:09
本发明专利技术公开了一种基于多尺度特征聚合的视觉地点识别方法,属于计算机视觉领域。本发明专利技术包括:多尺度特征提取模块,采用多种不同尺寸的卷积并行提取特征,扩大了感受野的大小,获得了多尺度特征,同时利用大卷积核尝试补充前面特征提取网络下采样步骤丢失的细节信息,使最终的全局特征同时保留丰富的细节信息和多尺度特征,能够应对视觉地点识别中的尺度变化,动态物体遮挡问题;特征聚合模块,使用连续的特征混合块,逐步将全局关系纳入特征中,保留整体结构信息,提升全局特征的表达能力,解决视角变化和光照变化挑战,获得更准确的定位结果。

【技术实现步骤摘要】

本专利技术属于计算机视觉领域,涉及一种基于多尺度特征聚合的视觉地点识别方法


技术介绍

1、视觉地点识别是给定查询图像,在数据库中检索同一场景图像,确定查询图像的拍摄位置。具体流程如下:给定一张查询图像,通过特征提取得到全局特征,然后与存在数据库中图像的全局特征进行特征匹配,匹配分数最高的数据库图像的位置就认为是查询图像的拍摄位置。这项技术在增强现实、自动驾驶、机器人等领域发挥着关键作用,能帮助这些系统准确判断当前位置。

2、在视觉地点识别领域,目前主要采用两种方法:一种是基于全局特征的方法,另一种是结合全局特征与局部特征的方法。这两种方法的共同点在于,它们都需要先从查询图像中提取全局特征,然后进行匹配。通常,这些全局特征是通过聚合局部特征得到。在早期,特征聚合方法主要依赖于如词袋技术和vlad算法等传统算法。随着深度学习的发展,netvlad模型在vlad算法的基础上提出了一种新的端到端网络架构,用于更有效地聚合全局特征。最近,transvpr技术提出了一种新颖的特征聚合方法,该方法通过融合视觉transformer中的多层特征,显著提升了全本文档来自技高网...

【技术保护点】

1.一种基于多尺度特征聚合的视觉地点识别方法,其特征在于包含特征提取网络、多尺度特征模块、特征聚合模块;

2.根据权利要求1所述的方法,其特征在于:

【技术特征摘要】

1.一种基于多尺度特征聚合的视觉地点识别方法,其特征在于包含特征提取网络、多尺度...

【专利技术属性】
技术研发人员:马伟李本冲
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1