基于RepVGG轻量级网络的图像匹配方法组成比例

技术编号：36455185 阅读：15 留言：0更新日期：2023-01-25 22:53

一种基于RepVGG轻量级网络的图像匹配方法，步骤为：步骤S1、构建轻量级特征提取网络，提取多通道特征图。步骤S2、从多通道特征图中提取特征点和计算描述子。步骤S3、使用FLANN算法进行特征匹配。步骤S4、采用改进的RANSAC算法剔除误匹配，得到最终匹配对。本发明专利技术是基于深度学习的一种特征匹配方法，提出了一种基于RepVGG轻量级网络的图像匹配方法。以RepVGG网络为基础，结合GCNv2网络的特点，针对图像匹配领域设计了一种结构简单、可读性强的轻量级特征匹配网络，节省算力的同时，使网络训练负担更小，易于训练和部署。易于训练和部署。易于训练和部署。

全部详细技术资料下载

【技术实现步骤摘要】
基于RepVGG轻量级网络的图像匹配方法

[0001]本专利技术属于图像匹配方法
，特别涉及一种基于RepVGG轻量级网络的图像匹配方法。

技术介绍

[0002]图像匹配是图像视觉领域重要的研究范畴，其本质，是寻找多张图像中对应位置关系的一项技术，由此基础可以解算相邻帧之间的相对运动状态、或者计算点云，是视觉导航、三维重建、视觉SLAM方向的基础研究领域。同时，由于视觉传感器可以获取丰富的纹理信息，拥有强大的场景辨识能力，所以从视觉出发解决相关领域问题的思路，受到研究人员的青睐。因此，研究一种实时图像匹配方法在视觉领域具有重要的应用价值。
[0003]近几年的文献及实验成果表明，基于深度学习的特征匹配方式较为流行。例如LoFTR算法(LoFTR:Detector
‑
Free Local Feature Matching with Transformers)，采取端到端匹配的方式，输入图像，直接输出匹配对；提取特征图，以及随后通过最优化传输问题的方式完成匹配，过程均在网络中进行。但是该种方法在特征点提取与匹配阶段比较耗时，在实时性方面仍有欠缺；并且一旦遇到遮挡就容易出现信息丢失，这对于部分使用场景是致命的。
[0004]此外，GCNv2算法(GCNv2:Efficient Correspondence Prediction for Real
‑
Time SLAM)已证明可以在gpu上实时运行，该方法在图像中提取特征点，并对其进行描述，计算其二值化或者计算其特征周...

【技术保护点】

【技术特征摘要】
1.一种基于RepVGG轻量级网络的图像匹配方法，其特征在于包括以下步骤：步骤S1、构建轻量级特征提取网络，提取多通道特征图；步骤S2、从多通道特征图中提取特征点和计算描述子；步骤S3、使用FLANN算法进行特征匹配；步骤S4、采用改进的RANSAC算法剔除误匹配，得到最终匹配对。2.根据权利要求1所述的基于RepVGG轻量级网络的图像匹配方法，其特征在于：步骤S1中，构建以RepVGG为骨干的下采样网络，采样特征图，方法如下：S101.构建一个RepVGG
‑
block：构建多分支结构，输入P经过一次3x3卷积和一次BN归一化得到P1，网络参数为N1；同时让图像P经过一次1x1卷积和一次BN归一化得到P2，网络参数为N2；同时让P经过一次BN归一化得到恒等自身映射P3，网络参数为N3，记作Identity层；在Identity层分支设置判断A，判断A：仅当该模块不改变特征通道数且卷积设置步长stride为1时，RepVGG
‑
block为正常结构，不改变；否则，删除此处Identity层分支，此时进行下采样；P1,P2,P3三者结果相加；随后使用GELU函数激活；当网络处于训练阶段，上述RepVGG
‑
block结构不变；当网络处于部署模型推理阶段，则对判断A中两种RepVGG
‑
block的网络参数进行结构重参数化，将多分支网络结构合并为单路网络结构；S102.使用RepVGG
‑
block构建轻量级下采样网络结构，将该RepVGG
‑
block模块堆叠8层，RepVGG
‑
block输入通道数定义为传入的特征通道数，输出通道数分别定义为[32,32,64,64,128,128,256,256]；其中1，3，5，7为下采样层；2,4,6,8,为正常RepVGG
‑
block结构；在第1层经过GELU函数激活后，加入CBAM模块；在第8层经过GELU函数激活后，加入CBAM模块，网络构建完成；将图像输入网络，得到通道数为256的特征图，定义为F。3.根据权利要求1所述的基于RepVGG轻量级网络的图像匹配方法，其特征在于：步骤S2的分解步骤如下：S201、将特征F分为两份F1，F2；F1使用sigmoid函数激活，得到预测概率图，记作convf；对于convf，通过PixelShuffle上采样，改变概率图的像素大小，使convf变为单通道且恢复至原始输入图像像素大小，记作ConvF；对ConvF执行非极大值抑制，记为NMS
‑
F，根据NMS
‑
F确定原始输入图像的特征点坐标，记作POS
‑
F；S202、...

【专利技术属性】
技术研发人员：冉昌艳，李维文，
申请(专利权)人：三峡大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人