视觉定位方法、装置、电子设备及存储介质制造方法及图纸

技术编号：30824510 阅读：29 留言：0更新日期：2021-11-18 12:17

本公开提供了一种视觉定位方法、装置、电子设备及存储介质，涉及计算机技术领域，具体涉及图像处理、计算机视觉和深度学习等人工智能技术领域。具体实现方案为：获取室内图像；对室内图像进行识别以获取室内图像的第一光学字符识别OCR信息，其中，第一OCR信息包括文本框内的文本信息和文本框内的图像特征点信息；以文本信息为索引从图像数据库之中进行查询，以获取至少一个候选图像的第一图像信息；根据图像特征点信息从至少一个候选图像的第一图像信息中获取目标图像的第二图像信息；以及根据第二图像信息和图像特征点信息确定室内图像的目标位置信息。由此，可以实现利用室内图像的OCR信息进行定位。像的OCR信息进行定位。像的OCR信息进行定位。

全部详细技术资料下载

【技术实现步骤摘要】
视觉定位方法、装置、电子设备及存储介质

[0001]本公开涉及计算机
，具体涉及图像处理、计算机视觉和深度学习等人工智能
，尤其涉及一种视觉定位方法、装置、电子设备及存储介质。

技术介绍

[0002]随着手机等便携摄影设备的发展，基于摄像头的低成本视觉定位方法逐渐受到大家的关注。基于图像的特征十分丰富，从最基础的特征点元素，到十分常见的线、面特征，以及偏向于人脑理解的高层语义特征。
[0003]相关技术中，主要使用图像的特征点来进行定位。

技术实现思路

[0004]本公开提供了一种视觉定位方法、装置、电子设备及存储介质。
[0005]根据本公开的一方面，提供了一种视觉定位方法，包括：
[0006]获取室内图像；
[0007]对所述室内图像进行识别以获取所述室内图像的第一光学字符识别OCR(Optical Character Recognition，光学字符识别)信息，其中，所述第一OCR信息包括文本框内的文本信息和所述文本框内的图像特征点信息；
[0008]...

【技术保护点】

【技术特征摘要】
1.一种视觉定位方法，包括：获取室内图像；对所述室内图像进行识别以获取所述室内图像的第一光学字符识别OCR信息，其中，所述第一OCR信息包括文本框内的文本信息和所述文本框内的图像特征点信息；以所述文本信息为索引从图像数据库之中进行查询，以获取至少一个候选图像的第一图像信息；根据所述图像特征点信息从所述至少一个候选图像的第一图像信息中获取目标图像的第二图像信息；以及根据所述第二图像信息和所述图像特征点信息确定所述室内图像的目标位置信息。2.根据权利要求1所述的方法，其中，所述对所述室内图像进行识别以获取所述室内图像的第一光学字符识别OCR信息，包括：获取图像识别模型；将所述室内图像输入至所述图像识别模型；通过所述图像识别模型对所述室内图像进行识别，以生成所述第一OCR信息。3.根据权利要求1所述的方法，其中，所述图像特征点信息包括图像特征点位置信息和图像特征点特征向量，所述第二图像信息包括所述目标图像的第二OCR信息，所述根据所述图像特征点信息从所述至少一个候选图像的第一图像信息中获取目标图像的第二图像信息，包括：将所述图像特征点特征向量分别与所述至少一个候选图像中每个所述候选图像对应的图像特征点特征向量进行匹配，以生成匹配结果；根据所述匹配结果从所述至少一个候选图像的第一图像信息中获取所述目标图像的第二图像信息。4.根据权利要求3所述的方法，其中，所述第二图像信息还包括所述目标图像的真实位姿，所述第二OCR信息包括所述文本框的平面参数，所述根据所述第二图像信息和所述图像特征点信息确定所述室内图像的目标位置信息，包括：根据所述真实位姿和所述平面参数，生成所述文本框内的图像特征点3D位置信息；根据所述图像特征点3D位置信息和所述图像特征点位置信息，生成所述目标位置信息。5.根据权利要求1所述的方法，其中，所述目标图像为多个，所述根据所述第二图像信息和所述图像特征点信息确定所述室内图像的目标位置信息，包括：分别根据多个所述目标图像的第二图像信息和所述图像特征点信息确定所述室内图像的多个初始位置信息；对所述多个初始位置信息进行全变量优化，以生成所述目标位置信息。6.一种视觉定位装置，包括：第一获取模块，用于获取室内图像；识别模块，用于对所述室内图像进行识别以获取所述室内图像的第一光学字符识别OCR信息，其中，所述第一OCR信息包括文本框内的文本信息和所述文本框内的图像特征点信息；第二获取...

【专利技术属性】
技术研发人员：张晋川，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人