基于结构化信息特征解耦与知识迁移的视觉场景识别方法技术

技术编号：32317931 阅读：32 留言：0更新日期：2022-02-16 18:23

本发明专利技术公开了一种基于结构化信息特征解耦与知识迁移的视觉场景识别方法，包括如下步骤：使用Canny边缘检测器提取图像的边缘表示形式，并基于自动编码器将其转换为边缘特征矢量；利用微调后的ResNet

全部详细技术资料下载

【技术实现步骤摘要】
基于结构化信息特征解耦与知识迁移的视觉场景识别方法

[0001]本专利技术涉及计算机视觉及机器人领域，具体涉及一种基于结构化信息特征解耦与知识迁移的视觉场景识别方法。

技术介绍

[0002]准确的场景识别有助于机器人认知自身的状态，很好地完成工作任务。所谓场景，指的是真实世界中，由传感器所记录的某一个时刻某一地点的数据，它包含了各种不同物体的组合。移动机器人的任务就是在不同时间段重复地访问同一场景，并判断出该场景是否是之前所经历过的。场景识别一般围绕“这是哪里”进行展开，通过对场景中的目标进行检测分析，或者进行稳定的特征提取，来对当前所处场景进行分析和判断。例如，在视觉SLAM(Simultaneous Localization and Mapping，即时定位与地图构建)过程中，精准的场景识别可以帮助机器人判断是否已处于之前访问过的环境区域，从而形成闭环检测并进行地图优化，这对于保证地图的一致性、减少累积误差是至关重要的。《IEEE international conference on robotics and automation(ICRA),1011
–
1018,2018》公开了一种可转换的生成器，它可以对图像的昼夜、季节等条件进行变换。该图像变换生成器是基于SURF检测器和稠密描述符所设计的，用于辅助特征匹配，从而在剧烈的外观变化下提高视觉场景识别和度量定位的精度。《IEEE International conference on robotics and automation(ICRA)...

【技术保护点】

【技术特征摘要】
1.一种基于结构化信息特征解耦与知识迁移的视觉场景识别方法，其特征在于，具体步骤如下：步骤一，使用Canny边缘检测器提取图像X的边缘表示形式X
CE
，并基于自动编码器将其转换为矢量X
CT
；步骤二，利用微调后的ResNet
‑
34提取图像X的外观特征表示X
AT
；步骤三，对于输入图像X，送入特征解耦网络，则会分别生成结构化特征向量X
SC
与外观特征向量X
A
；随后，X
SC
被送入至D
AA
用于判断所提取的结构化特征向量是否来自于同一个域。此外，X
SC
的特征分布将会与内容教师模块生成的X
CT
进行对比。至于X
A
，它不仅会被三元组损失函数进行优化，其分布还会与外观教师模块生成的X
AT
进行对比；步骤四，解码器D
E
整合输入的特征并重构原始图像，用于鼓励所学习的内容特征与外观特征能够形成完整的输入图像的表示；提取结构化特征向量X
SC
作为最终的场景特征，并利用余弦距离计算优化特征间的相似度，实现视觉场景识别。2.根据权利要求1所述的一种基于结构化信息的特征解耦与知识迁移的视觉场景识别方法，其特征在于，所述步骤一的具体过程如下：首先为了实现二维的射影变换，需要找到图像中的四个点来估测单应性矩阵。在每帧图像的角落的边框内随机选择四个点。边框的大小设定为来确保视角变化的合理程度。H和W分别为图像的宽度与高度；图像的边缘表示形式为X
CE
＝Canny(X)
ꢀꢀꢀꢀꢀꢀ
(1)Canny(
·
)为Canny边缘检测器提取边缘操作；边缘的矢量表示则为：X
CT
＝Auto_encoder(X
CE
)
ꢀꢀꢀꢀ
(2)Auto_encoder(
·
)为自动编码器的特征编码操作。3.根据权利要求1所述的一种基于结构化信息的特征解耦与知识迁移的视觉场景识别方法，其特征在于，所述步骤二的具体过程为：对于输入图像X，利用微调后的ResNet
‑
34提取外观特征表示X
AT
：X
AT
＝ResNet(X)
ꢀꢀꢀꢀ
(3)ResNet(
·
)为提取ResNet
‑
34的倒数第二层特征的操作。4.根据权利要求1所述的一种基于结构化信息的特征解耦与知识迁移的视觉场景识别方法，其特征在于，所述步骤三的具体过程为：外观特征通过编码器E
A
进行提取，表示为：X
A
＝E
A
(X)
ꢀꢀꢀꢀ
(4)通过如下损失函数来对外观编码器进行训练：其中α控制分离的边缘，且y
ij
∈{
‑

【专利技术属性】
技术研发人员：张云洲，秦操，刘英达，杨非，杜承垚，
申请(专利权)人：东北大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人