位姿预测方法、装置、电子设备和介质制造方法及图纸

技术编号：35785948 阅读：17 留言：0更新日期：2022-12-01 14:33

本申请提出一种位姿预测方法、装置、电子设备和介质，涉及图像处理技术领域。该方法包括：确定与待查询图像的场景相似的多个参考图像；确定待查询图像与多个参考图像之间的位姿差异信息；将位姿差异信息输入至视觉定位网络中进行预测，确定待查询图像对应的目标位姿信息。通过缩小图像的处理范围，减少与应用场景的语义信息的相关性，并明确待查询图像与多个参考图像之间的位姿差异信息，进一步缩小图像的处理范围；将位姿差异信息输入至视觉定位网络中进行预测，确定待查询图像对应的目标位姿信息，以使用视觉定位网络对位姿差异信息进行处理，获得能够衡量待查询图像中的目标的实时位姿的目标位姿信息，提升对目标的定位准确性。性。性。

全部详细技术资料下载

【技术实现步骤摘要】
位姿预测方法、装置、电子设备和介质

[0001]本申请涉及图像处理
，具体涉及一种位姿预测方法、装置、电子设备和介质。

技术介绍

[0002]目前，针对视觉定位的算法，多是与应用场景的语义信息相关，在不同的数据集上利用其语义信息对定位模型进行训练，可获得不同的视觉定位模型。
[0003]但是，在实际应用中，不同的视觉定位模型无法适用于多样性的应用场景中。例如，在在增强现实(Augmented Reality，AR)的导航过程中，通常采用云端服务器对图像特征进行匹配，但由于用户的位置是实时变化的，其所处场景具有多样性，若使用某种特定的应用场景的定位模型对用户进行定位，无法实现应用场景的泛化处理，降低了定位的准确性。

技术实现思路

[0004]本申请提供一种位姿预测方法、装置、电子设备和介质。
[0005]本申请实施例提供一种位姿预测方法，方法包括：确定与待查询图像的场景相似的多个参考图像；确定所述待查询图像与多个所述参考图像之间的位姿差异信息；将所述位姿差异信息输入至视觉定位网络中进行预测，确定所述待查询图像对应的目标位姿信息。
[0006]本申请实施例提供一种位姿预测装置，其包括：参考图像确定模块，被配置为确定与待查询图像的场景相似的多个参考图像；位姿差异信息确定模块，被配置为确定所述待查询图像与多个所述参考图像之间的位姿差异信息；预测模块，被配置为将所述位姿差异信息输入至视觉定位网络中进行预测，确定所述待查询图像对应的目标位姿信息。
[0007]本申请实施例提供...

【技术保护点】

【技术特征摘要】
1.一种位姿预测方法，其特征在于，所述方法包括：确定与待查询图像的场景相似的多个参考图像；确定所述待查询图像与多个所述参考图像之间的位姿差异信息；将所述位姿差异信息输入至视觉定位网络中进行预测，确定所述待查询图像对应的目标位姿信息。2.根据权利要求1所述的方法，其中，所述确定与待查询图像的场景相似的多个参考图像，包括：依据所述待查询图像对图像数据库进行图像检索，获得多个与所述待查询图像在同一位置范围内的待处理图像；依据预设视觉聚类算法对多个所述待处理图像进行分析，获得多个与所述待查询图像对应的位置信息相似的图像，作为所述参考图像。3.根据权利要求2所述的方法，其特征在于，所述确定所述待查询图像与多个所述参考图像之间的位姿差异信息，包括：以特征金字塔的方式，分别对所述待查询图像和多个所述参考图像进行特征提取，获得所述待查询图像的特征金字塔、以及多个与所述参考图像对应的场景特征金字塔；将所述待查询图像的特征金字塔中的图像特征，分别与多个所述场景特征金字塔中的场景特征进行对齐，确定所述位姿差异信息。4.根据权利要求3所述的方法，其特征在于，所述目标位姿包括：平移自由度和/或旋转自由度；其中，所述平移自由度包括：基于世界坐标系中的X轴的前后移动自由度、Y轴的左右移动自由度和Z轴的上下移动自由度中的至少一种；所述旋转自由度包括纵摇自由度、横摇自由度和垂摇自由度中的至少一种；所述差异位姿信息包括：平移向量信息和/或旋转矩阵信息，所述平移向量信息用于表征所述平移自由度的信息，所述旋转矩阵信息为基于矩阵的方式表征所述旋转自由度的信息；所述将所述位姿差异信息输入至视觉定位网络中进行预测，确定所述待查询图像对应的目标位姿信息，包括：依据非线性最小二乘算法对所述平移向量信息和/或所述旋转矩阵信息进行估计，获得所述目标位姿。5.根据权利要求3所述的方法，其特征在于，所述以特征金字塔的方式，分别对所述待查询图像和多个所述参考图像进行特征提取，获得所述待查询图像的特征金字塔、以及多个与所述参考图像对应的场景特征金字塔，包括：将所述待查询图像输入至深度残差网络中进行特征提取，获得所述待查询图像的特征金字塔，其中，所述深度残差网络包括多个分辨率不同的特征提取模块，所述分辨率的数量与所述特征金字塔的层数相同；将多个所述参考图像分别输入至所述深度残差网络中进行特征提取，获得多个所述场景特征金字塔，其中，所述场景特征金字塔包括室内场景特征金字塔和/或室外场景特征金字塔。6.根据权利要求5所述的方法，其特征在于，所述将所述待查询图像输入至深度残差网络中进行特征提取，获得所述待查询图像的特征金字塔，包括：
采用预设数量的分辨率，分别对所述待查询图像进行特征提取，获得多个待处理特征，其中，每个所述待处理特征对应的分辨率不同；依据所述预设数量的分辨率，对预设场景坐...

【专利技术属性】
技术研发人员：施文哲，陆平，盛斌，孟子尧，赵义成，
申请(专利权)人：中兴通讯南京有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人