一种从图像中恢复三维几何信息的方法技术

技术编号：2952265 阅读：301 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及一种从图像中恢复三维几何信息的方法。所述方法包括：获取大量场景图像及其对应的深度图作为训练库；划分所述图像为图像块，利用统计学习方法描述其对应于不同深度的概率并得到不同的参数值；对用于场景重建的图像对建立包含图像块层、像素层以及连接像素和对应图像块的边的图结构；利用统计学习所获的参数定义上述图结构的能量项；将所述能量项作为约束加入到传统立体匹配的描述像素和像素之间视差关系的图中；求解出两幅图像之间的视差图。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机视觉领域，具体涉及一种从图像中恢复三维几何信息的方法。
技术介绍
立体匹配一直是计算机视觉和摄影测量学中的重要问题。两幅图像在很接近的视角上分别记录了真实世界的场景，双目线索就是指物体投影在两个成像平面的不同位置，位置的差异随着物体深度的变化而相应变化。在过去的数十年里，大量的立体视觉系统被提出，使得该领域的研究出现了长足的进步。但是，由于问题本身的病态性，依旧没能得到完全的解决。在现有的立体匹配方法中，基于图的方法是当中最流行的技术。它能得到和观察数据吻合的平滑视差图。比较典型的做法是利用图割法(graph c ut s )来优化由数据项和平滑项构成的能量函数，其中数据项用来度量两幅图像对应像素之间的颜色一致性，平滑项则是为了保证视差图整体的平滑，在相邻的像素点被赋予不一样的视差时给予适当的惩罚。当然，为了能够处理遮挡问题，可以在颜色一致性约東和平滑约束之外，加入匹配的唯一性约束。另外，也有工作利用主图像上的颜色分块，将能量函数同时定义在像素层和颜色块层上。这样，像素层可以很好地度量颜色一致性以及进行遮挡检测，颜色块层上则可以更为合理地定义平滑约束。另一方面，单幅图像中丰富的紋理、色彩、焦距和雾化等信息也可以提供重要的深度推断线索。有了足够丰富的先验知识，从单幅图像中获取场景的整体三维结构是可以实现的，但这是一个很难的问题。很多的单目线索不仅依赖于先验知识，还依赖于整体的上下文信息，因此不仅难以用启发式的约東，也很难从图像的局部出发来进行推测。要让机器视觉的能力接近这个目标，我们需要大量的训练数...

【技术保护点】
一种从图像中恢复三维几何信息的方法，其特征在于，所述方法包括以下步骤：　Ｓ１：获取场景图像及其对应的深度图作为训练库；　Ｓ２：划分所述图像为图像块，利用统计学习方法以下式描述其对应于不同深度的概率并得到不同的参数值：　Ｐ↓［Ｌ］（ｚ｜Ｘ；θ，λ）＝１／Ｎ↓［Ｌ］ｅｘｐ（－＊｜ｚ↓［ｉ］－ｘ↓［ｉ］↑［Ｔ］θ↓［ｒ］｜／λ↓［１ｒ］－＊＊｜ｚ↓［ｉ］－ｚ↓［ｊ］｜／λ↓［２ｒ］）　其中，Ｎ↓［ｉ］是图像块ｉ的四连通邻域，Ｍ是深度图中深度值的总数目，ｘ↓［ｉ］是图像块ｉ的特征向量，包括图像块及其邻域在三个不同尺度上滤波器返回值的绝对值和以及平方和，Ｎ↓［Ｌ］是归一化常数，θ、λ为参数，θ↓［ｒ］，λ↓［１ｒ］，λ↓［２ｒ］为图像第ｒ行的参数；　Ｓ３：对用于场景重建的图像对，建立包含图像块层、像素层以及连接像素和对应图像块的边的图结构；　Ｓ４：利用步骤Ｓ２中统计学习获得的参数定义上述图结构的能量项；　Ｓ５：将所述能量项作为约束加入到传统立体匹配的描述像素和像素之间视差关系的图中；　Ｓ６：求解出两幅图像之间的视差图。

【技术特征摘要】

【专利技术属性】
技术研发人员：马祥音，李仁举，查红彬，英向华，
申请(专利权)人：北京大学，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人