一种基于连续视频的机器人场景深度判别方法技术

技术编号：3959160 阅读：330 留言：0更新日期：2012-04-11 18:40

本发明专利技术属于机器视觉模拟、图像匹配技术领域，具体为一种基于连续视频的机器人场景深度判别方法。该方法包括：对场景进行拍摄，获取不同位置的场景照片；对拍摄的照片进行图像匹配，然后通过场景的深度计算公式，得到场景的深度地图。其中，本发明专利技术采用了新的摄像坐标设定方法。图像匹配利用待匹配点所在区域的光强度矩阵，寻找与之接近的区域，新区域的中心点即为匹配点。本发明专利技术方法计算量较小，准确率高，稳定性好。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于机器人视觉模拟、图像匹配
，具体涉及一种机器人场景深度判别方法。
技术介绍
人具有感知三维世界的能力。在一场景中，人的左右眼以不同的视点来观察同一个目标，所以在左右眼中所形成的图像有稍微的差别，而大脑利用这些差别再进行信息加工即可估算出目标的深度。这就是人感知三维场景中目标深度的原理。许多研究者，试图让被赋予三维感知能力的机器能在未知场景中自由地探索，机器通过建立场景的三维模型或者是场景的深度地图，来“理解”场景，从而能够完成被赋予的任务。对于场景的三维重建和深度估算，人们提出了各种各样的方法。例如，通过维护由单目图像和对应的深度图组成的训练集，用学习的方法来进行深度估算；在中，作者把单目线索加入到立体视觉系统中，获得了更精确的深度估算；提出了一个能从单目图像上重建平面法向的互动系统。在这些研究尝试中，人们以各种各样的方法来模拟人的视觉系统，有摄像机、激光、声纳及各种射线等等。其中，(1)激光和各种射线可以用来测距，对场景进行深度估算，能够达到很高的精度，并且重量轻功耗小，但是它们只能对场景中某一点或者某一小片的范围进行测距，不能像相机那样记录下整个场景的信息，所以激光测距不适合复杂场景的深度估算。在中，作者分析了激光的各种性能，也提到了激光对人眼的伤害；因此综合考虑激光的各种性能，激光更适合于军事武器的制导作用等军用。(2)声纳技术由于其成本高、体积重量大、能耗大，很难被用于小型测距探测系统，而由于其在水中传播的稳定性，故常常用于水下通信和导航、以及鱼雷制导、水雷引信等领域。最常用就是摄像机(或者照相机...

【技术保护点】
一种基于连续视频的机器人场景深度判别方法，其特征在于具体步骤如下：１）在一未知场景中，装备上单目视觉系统的机器人通过拍照获得关于场景的一张照片Ｐ１，再向前移动适当的距离，设长度为Ｓ，再拍照获得关于场景的另一种照片Ｐ２；２）对照片Ｐ２进行角点检测，对于照片Ｐ２上的每一个角点Ａ２，利用本专利技术提出的关于单目机器人时间邻近帧图像的匹配方法进行匹配，从而在照片Ｐ１上找出Ａ２的匹配点Ａ１；所述的匹配利用待匹配点所在的一块合适大小的区域的光强度矩阵，寻找与该光强接近的另一块同样大小的区域，新区域的中心点即为匹配点；３）利用本专利技术请提出的单目机器人连续移动使用前后帧图像的深度计算方法，计算出场景中每一个角点对应的目标的深度，从而形成一个深度地图；其中，涉及到单目机器人坐标体系的设定，假设三维场景中目标的空间位置点Ａ在摄像坐标系中的坐标为Ａ（ｘ↓［Ａ］，ｙ↓［Ａ］，ｚ↓［Ａ］），Ａ点的投影点Ａ′的坐标为Ａ′（ｘ↓［Ａ］′，ｙ↓［Ａ］′，ｆ），其关系为：＊＊＊Ａ′（ｘ↓［Ａ］′，ｙ↓［Ａ］′，ｆ）的坐标值由照片的信息获得，ｆ为镜头的焦距；所述单目机器人时间邻近帧图小的匹配方法，具体如下：设待匹配图...

【技术特征摘要】

【专利技术属性】
技术研发人员：危辉，林祥明，
申请(专利权)人：复旦大学，
类型：发明
国别省市：31[中国|上海]

全部详细技术资料下载我是这个专利的主人