一种室内鱼眼图像的全自动布局恢复方法技术

技术编号：26651782 阅读：16 留言：0更新日期：2020-12-09 00:53

本发明专利技术提供了一种室内鱼眼图像的全自动布局恢复方法，步骤为：(1)构建室内鱼眼图像数据集；(2)建立基于变形卷积的神经网络模型，设置相应的模型参数；(3)将训练集输入模型进行训练优化；(4)将测试集输入优化后的模型，输出角点概率图和边概率图；(5)将角点概率图二值化，提取角点图像坐标，基于正交投影模型和角点图像坐标，恢复三维室内布局。对于给定的RGB鱼眼图像，本方法首次实现了从单幅鱼眼图像中端到端地恢复出三维室内场景布局，应用于机器人技术和虚拟/增强现实，提升了室内场景理解的速度和精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种室内鱼眼图像的全自动布局恢复方法
本申请实施例涉及室内场景理解
，尤其涉及一种室内鱼眼图像的全自动布局恢复方法。
技术介绍
室内场景理解
是指通过对室内场景进行视觉分析，从而得到室内场景的空间布局结构。室内布局估计作为室内场景理解的一个子任务，是指从单张或多张室内照片中估计出三维室内布局，在机器人导航、虚拟/增强现实、智慧城市、室内监控等领域有广泛的应用。室内布局估计
发展出了很多方法，大多数的方法假设室内布局满足曼哈顿世界模型。传统的室内布局估计方法根据透视图像内的几何信息提取场景内的直线，生成一系列的布局估计假设，然后基于方位图、几何上下文信息选出最符合真实场景的假设最后布局估计的结果。传统相机拍摄得到的透视图的视角较小，每次只能恢复出室内布局的局部结构，因此YindaZhang等人提出使用视角360°的全景图像用于室内布局估计。卷积神经网络在图像分割、目标识别、图像分类等问题上较好的表现让研究者开始探索基于卷积神经网络解决室内布局估计问题。Zou等人提出一个名为LayoutNet的网络改进布局估计，Sun等人提出名为HorizonNet的网络学习室内布局。但是，全景图像是将多张透视图像经过图像拼接得到的，会引入一定的误差；而且全景相机拍摄全景图像的成本较高。
技术实现思路
本专利技术的技术解决问题：克服全景图像存在一定误差以及拍摄成本高的不足，提出一种室内鱼眼图像的全自动布局恢复方法。本专利技术的技术解决方案如下：一种室内鱼眼图像...

【技术保护点】
1.一种室内鱼眼图像的全自动布局恢复方法，其特征在于，包括如下步骤：/n(1)构建室内鱼眼图像数据集；/n(2)建立基于变形卷积的神经网络模型，设置相应的模型参数；/n(3)将训练集输入模型进行训练优化；/n(4)将测试集输入优化后的模型，输出角点概率图和边概率图；/n(5)将角点概率图二值化，提取角点图像坐标，基于正交投影模型和角点图像坐标，恢复三维室内布局。/n

【技术特征摘要】
1.一种室内鱼眼图像的全自动布局恢复方法，其特征在于，包括如下步骤：
(1)构建室内鱼眼图像数据集；
(2)建立基于变形卷积的神经网络模型，设置相应的模型参数；
(3)将训练集输入模型进行训练优化；
(4)将测试集输入优化后的模型，输出角点概率图和边概率图；
(5)将角点概率图二值化，提取角点图像坐标，基于正交投影模型和角点图像坐标，恢复三维室内布局。

2.根据权利要求1所述的一种室内鱼眼图像的全自动布局恢复方法，其特征在于：所述步骤(1)构建室内鱼眼图像数据集，包括：
(1.1)获取室内场景的RGB鱼眼图像和角点图像坐标，即角点在鱼眼图像中的坐标；
(1.2)生成像素值全为0、大小为1024×1024的像素矩阵，以每个角点图像坐标为圆心，将半径为6的区域内的像素值改为(0,0,255)，把修改后的像素矩阵保存为单通道的角点图；
(1.3)基于角点图像坐标，生成1024×1024的三通道边图。

3.根据权利要求1所述的一种室内鱼眼图像的全自动布局恢复方法，其特征在于：所述步骤(2)建立基于变形卷积的神经网络模型，包括：
(2.1)提取鱼眼有效区域：以像素点(512,512)为圆心，半径为512像素的区域，将有效区域外像素点的偏移量设置为(0,0)；
(2.2)基于正交投影模型和变形卷积提出正交卷积OrthConv，求解有效区域内像素点的偏移量，即正交卷积与标准卷积采样点坐标的差值；
(2.3)建立基于变形卷积、遵循编码器-解码器策略的网络模型。

4.根据权利要求1所述的一种室内鱼眼图像的全自动布局恢复方法，其特征在于：所述步骤(5)将角点概率图二值化，提取角点图像坐标，基于正交投影模型和角点图像坐标，恢复三维室内布局，包括：
(5.1)将角点概率图二值化，标记二值图像中的连通区域；
(5.2)求取连通区域的重心作为角点图像坐标；
(5.3)基于正交投影，将图像坐标转换为空间三维坐标，生成室内布局的三维点云；
(5.4)将点云的三维空间坐标映射为图像坐标，生成布局纹理。

5.根据权利要求2所述的一种室内鱼眼图像的全自动布局恢复方法，其特征在于：所述步骤(1.3)中基于角点图像坐标，生成1024×1024的三通道边图，包括：
...

【专利技术属性】
技术研发人员：肖立凯，孟明，周忠，周颐，
申请(专利权)人：北京大视景科技有限公司，北京航空航天大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人