【技术实现步骤摘要】
本专利技术涉及一种,属于计算机视觉和图像处理
技术介绍
从单幅图像中恢复场景的三维结构是计算机视觉中的一个经典问题和典型的病态问题,其难度在于,图像是由场景内容经过摄像机从三维空间投影到了二维成像平面上,关于场景三维结构的几何信息不可避免的受到了损失,从而使该问题病态化。而人类却能够通过自身的认知,准确的从一幅图像中识别出场景中的空间结构、远近关系等三维信息。所以,在计算机视觉领域中,关于单幅图像的三维场景重建一直致力于模仿人类认知,从图像的像素级信息中获取各种有助于三维场景理解的信息来实现三维场景重构。 关于单幅图像三维重建的研究一直是计算机视觉领域的关注点之一,每年都有大量的文章发表,提出新的方法或理论。经典的单幅图像三维重建方法包括利用场景中存在的平行线、平行面关系来进行消失点、消失线的推断从而获取场景几何信息;利用场景中纹理一致性的约束,更具相似纹理的大小关系恢复其所在位置的空间深度(层次)信息;根据自然场景中大气浓度、雾气或者摄像机焦距引起图像上不同区域的成像的清晰度来推断场景的空间信息等。 上述方法明显存在的问题是,对数据的依赖性强,显然 ...
【技术保护点】
一种单幅图像的三维场景重建方法,其特征在于,包括以下步骤:图像输入步骤,输入图像序列中的各幅图像;特征提取步骤,从所述图像的场景中提取特征,基于提取的特征进行场景分类、物体识别,从而获取语义信息,同时基于所述提取的特征进行单目几何信息的提取,并获得单目几何信息;物体检测步骤,基于所述提取的特征,并参照所述场景分类进行物体检测;三维图形基元模型选择步骤,根据所述物体检测的结果选择三维图形基元模型;以及场景三维模型生成步骤,根据场景语义先验、所述三维图形基元模型和所述单目几何信息进行场景三维模型的推理和验证,从而生成最终的场景三维模型。
【技术特征摘要】
一种单幅图像的三维场景重建方法,其特征在于,包括以下步骤图像输入步骤,输入图像序列中的各幅图像;特征提取步骤,从所述图像的场景中提取特征,基于提取的特征进行场景分类、物体识别,从而获取语义信息,同时基于所述提取的特征进行单目几何信息的提取,并获得单目几何信息;物体检测步骤,基于所述提取的特征,并参照所述场景分类进行物体检测;三维图形基元模型选择步骤,根据所述物体检测的结果选择三维图形基元模型;以及场景三维模型生成步骤,根据场景语义先验、所述三维图形基元模型和所述单目几何信息进行场景三维模型的推理和验证,从而生成最终的场景三维模型。2. 根据权利要求1所述的单幅图像的三维场景重建方法,其特征在于,在所述物体检 测步骤和所述三维图形基元模型选择步骤之间还包括物体部件检测步骤,基于所述物体检 测的结果,对所述物体部件进行检测,其中,在所述三维图形基元模型选择步骤中,根据所 述物体检测以及所述物体部件检测的结果选择所述三维图形基元模型。3. 根据权利要求2所述的单幅图像的三维场景重建方法,其特征在于,在所述特征提 取步骤中,利用所述图像的场景中上下文相关图像以及自底向上和自顶向下的推理方法对 所述场景的语义信息进行层次化的描述,将所述图像的场景描述为场景类别层、物体层、物 体部件层和图像特征层四个层面。4. 根据权利要求3所述的单幅图像的三维场景重建方法,其特征在于,在对所述场景 的语义信息的层次化描述中,基于场景分类、物体识别获取所述图像的场景的基本语义信 息,同时使用所述场景中各种组成部分的上下文关系,即先验模型,以强化语义信息,并对 所述基本语义信息进行约束。5. 根据权利要求3所述的单幅图像的三维场景重建方法,其特征在于,使用马尔可夫 随机场来描述所述物体层和所述物体部件层中各个元素之间的空间关系和语义关系,使用 上下文无关文法对各层之间元素的包容关系或者依属关系进行建模,以形成由基本像素信 息到图像特征信息、物体部件信息、物体类别信息、场景类别信息的统一描述。6. 根据权利要求3所述的单幅图像的三维场景重建方法,其特征在于,利用所述语义 约束关系以及所述单目几何信息,对所述三维图形基元进行验证和组合,从而求解出整个 场景的场景三维模型。7. 根据权利要求6所述的单幅图像的三维场景重建方法,其特征在于,在所述场景三 维模型生成步骤中,利用以下的数学模型1 :<formula>formula see original docum...
【专利技术属性】
技术研发人员:王亦洲,张哲斌,高文,
申请(专利权)人:北京大学,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。