用于三维几何引导的师生特征匹配(3DG-STFM)的系统技术方案

技术编号：37996818 阅读：29 留言：0更新日期：2023-06-30 10:10

本发明专利技术公开了一种用于三维几何引导的师生特征匹配的系统，包括多模态教师模型、单模态学生模型、粗级知识转移损失函数和细级知识转移损失函数。多模态教师模型用于确定一对RGB

全部详细技术资料下载

【技术实现步骤摘要】
用于三维几何引导的师生特征匹配(3DG
‑
STFM)的系统

[0001]本专利技术涉及图像处理领域，特别涉及一种用于三维几何引导的师生特征匹配(3DG
‑
STFM)的系统，以在重叠图像之间建立对应关系。

技术介绍

[0002]建立重叠图像之间的对应关系对于许多计算机视觉任务至关重要，比如运动推断结构(SfM)、即时定位与地图构建(SLAM)、视觉定位等。
[0003]大多数解决该问题的现有技术遵循经典的三阶段流程，即特征检测、特征描述和特征匹配。为了生成不受光照或视角变化影响的鲁棒描述子，对传统的手动特征描述子，例如SIFT、SURF和BRISK，和深度网络表示特征进行了深入研究。通过基于最近邻搜索或可学习匹配策略的匹配算法可以产生点对点对应。
[0004]利用图形神经网络(GNN)，基于学习的匹配系统SuperGlue在两组关键点之间构建密集连接的图。使用自注意力和交叉注意力机制在GNN中集成和交换关键点的几何相关性及其视觉特征。然而，那些基于检测器的局部特征匹配算法只产生稀疏的关键点，尤其是在低纹理区域。
[0005]因此，在本领域仍需要解决上述缺陷和不足。

技术实现思路

[0006]基于上述现有技术中的缺陷与不足，本专利技术的一个目的在于提供一种框架/架构，利用RGB诱导的深度信息来提高局部特征匹配性能。本专利技术的另一个目的在于提供一种模型压缩系统，以训练出高效、轻权重的模型，从而消耗更少的计算资源，其匹配质量和准确性更高。特别地，本...

【技术保护点】

【技术特征摘要】
1.一种用于三维几何引导的师生特征匹配(3DG
‑
STFM)的系统，包括：多模态教师模型，用于确定一对RGB
‑
D图像之间的特征匹配，其中，每个RGB
‑
D图像为RGB图像及其对应深度图像的组合，所述深度图像为图像通道，所述图像通道中的每个像素与所述RGB图像中图像平面与对应对象之间的距离有关；单模态学生模型，用于从所述RGB图像对和所述教师模型中确定特征匹配，其中，所述教师模型引导所述学生模型学习RGB诱导深度信息，以进行粗级和细级特征匹配；粗级知识转移损失函数，用于确定将粗级匹配知识从所述教师模型转移到所述学生模型的损失；以及细级知识转移损失函数，用于确定将细级匹配知识从所述教师模型转移到所述学生模型的损失，且引导所述学生模型优先学习细级预测分布。2.如权利要求1所述的系统，其中，每个所述教师模型和所述学生模型均包括特征金字塔网络(FPN)，所述FPN用于从所述图像对中提取具有1/8原始图像分辨率的粗级局部特征和具有1/2原始图像分辨率的细级特征。3.如权利要求2所述的系统，其中，所述教师模型的FPN为所述RGB
‑
D图像的四通道输入，所述学生模型的FPN为所述RGB图像的三通道输入，其中D表示深度信息。4.如权利要求2所述的系统，其中，每个所述教师模型和所述学生模型还包括粗级局部特征转换模块、粗级匹配模块和细级匹配模块。5.如权利要求4所述的系统，其中，所述粗级局部特征转换模块用于：将提取的粗级特征图展平为一维向量；对展平的一维向量进行位置编码，以对每个特征条目分配一个正弦格式的唯一嵌入向量，从而对空间信息进行编码；以及通过包含自注意力层和交叉注意力层的粗级匹配转换器处理已编码的局部特征向量，以生成包含相关矩阵的逻辑层。6.如权利要求5所述的系统，其中，所述自注意力层和所述交叉注意力层以L
c
的倍数交错在所述粗级匹配转换器中。7.如权利要求5所述的系统，其中，所述粗级匹配模块用于：通过在行方向和列方向上对所述相关矩阵S
c
应用双重softmax操作来生成置信分数矩阵P
c
，其中：P
c
(i,j)＝softmax(S
c
(i,
·
)
j
)*softmax(S
c
(
·
,j)
i
)P
c
(i,j)为匹配位置(i，j)处的匹配概率；以及选择概率分数高于阈值θ
c
的匹配对以生成粗级匹配预测。8.如权利要求7所述的系统，其中，给定从对应标签导出的真值矩阵，通过下式计算测量所述粗级局部特征转换模块和所述粗级匹配模块性能的交叉熵损失：量所述粗级局部特征转换模块和所述粗级匹配模块性能的交叉熵...

【专利技术属性】
技术研发人员：毛润钰，白宸，吕骋，安亚通，
申请(专利权)人：广州小鹏自动驾驶科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人