【技术实现步骤摘要】
本专利技术属于计算机视觉领域,涉及一种基于多尺度特征聚合的视觉地点识别方法。
技术介绍
1、视觉地点识别是给定查询图像,在数据库中检索同一场景图像,确定查询图像的拍摄位置。具体流程如下:给定一张查询图像,通过特征提取得到全局特征,然后与存在数据库中图像的全局特征进行特征匹配,匹配分数最高的数据库图像的位置就认为是查询图像的拍摄位置。这项技术在增强现实、自动驾驶、机器人等领域发挥着关键作用,能帮助这些系统准确判断当前位置。
2、在视觉地点识别领域,目前主要采用两种方法:一种是基于全局特征的方法,另一种是结合全局特征与局部特征的方法。这两种方法的共同点在于,它们都需要先从查询图像中提取全局特征,然后进行匹配。通常,这些全局特征是通过聚合局部特征得到。在早期,特征聚合方法主要依赖于如词袋技术和vlad算法等传统算法。随着深度学习的发展,netvlad模型在vlad算法的基础上提出了一种新的端到端网络架构,用于更有效地聚合全局特征。最近,transvpr技术提出了一种新颖的特征聚合方法,该方法通过融合视觉transformer中的多
...【技术保护点】
1.一种基于多尺度特征聚合的视觉地点识别方法,其特征在于包含特征提取网络、多尺度特征模块、特征聚合模块;
2.根据权利要求1所述的方法,其特征在于:
【技术特征摘要】
1.一种基于多尺度特征聚合的视觉地点识别方法,其特征在于包含特征提取网络、多尺度...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。