【技术实现步骤摘要】
基于条件生成对抗网络的室内场景布局估计方法和装置
本专利技术涉及一种基于条件生成对抗网络(cGAN)的室内场景布局估计方法和装置,属于图像场景理解
技术介绍
图像场景理解一直都是计算机视觉领域的研究热点,室内场景布局估计作为其初始也是关键单元,基本目标是根据给定的室内场景图像恢复出场景内房间的布局结构。用一个3维立体盒子模拟室内空间布局,从中找到墙-地板、墙-墙、墙-天花板的边界,然而,因为场景内部存在大量的杂物,例如家具、个人等,都会对房间的布局边界造成遮挡,使得布局的恢复变得极具挑战性。准确的房间布局估计需要计算机来从总体视角来理解房间,而不仅仅依赖于局部线索。且完整的原始图像信息和学习能力强大且简单的网络框架能够使计算机更好地理解室内场景的空间结构布局。近年来,许多的场景布局估计研究工作中致力于提出有效的方法进行布局估计。文献[HedauV,HoiemD,ForsythD.Recoveringthespatiallayoutofclutteredrooms.InternationalConferenceonComputerVision.2009:1849-1856.]提出将房间布局边界参数化为3D盒模型结构,基于估计的消失点生成布局候选项,提取线段、几何上下文等特征进行学习。文献[LeeDC,HebertM,KanadeT.Geometricreasoningforsingleimagestructurerecovery.ComputerVisionandPatternRecognition.2009:2136-2143.]在此基础之上又引 ...
【技术保护点】
1.一种基于条件生成对抗网络的室内场景布局估计方法,其特征在于,包括以下步骤:(1)运用训练集训练条件生成对抗网络,训练集中样本的格式为AB模式,即室内场景图像和其对应的边缘图并行排列,所述条件生成对抗网络包括生成网络和判别网络,室内场景图像作为生成网络的输入,由生成网络生成的室内场景图像对应的边缘图作为判别网络的输入;所述生成网络输出的边缘图与输入的室内场景图像尺寸相同;(2)将待测的室内场景图像输入训练完成的条件生成对抗网络,得到预测布局边缘图;(3)估计待测的室内场景图像中的位于垂直方向和水平方向上的三个消失点,对于每个消失点等角度间隔的引出射线生成若干扇形区域;(4)对于每个消失点,根据预测布局边缘图中对应扇形区域的平均边缘强度最大准则和消失点类型选择一或两个扇形区域作为采样扇形区域;(5)对预测布局边缘图加高斯模糊,然后对采样扇形区域进行采样,由在采样扇形区域中从三个消失点引出的射线两两相交生成一系列布局候选项;(6)计算各布局候选项与预测布局边缘图的相似度,并选出与预测布局边缘图最为相似的布局估计作为最终的布局估计结果。
【技术特征摘要】
1.一种基于条件生成对抗网络的室内场景布局估计方法,其特征在于,包括以下步骤:(1)运用训练集训练条件生成对抗网络,训练集中样本的格式为AB模式,即室内场景图像和其对应的边缘图并行排列,所述条件生成对抗网络包括生成网络和判别网络,室内场景图像作为生成网络的输入,由生成网络生成的室内场景图像对应的边缘图作为判别网络的输入;所述生成网络输出的边缘图与输入的室内场景图像尺寸相同;(2)将待测的室内场景图像输入训练完成的条件生成对抗网络,得到预测布局边缘图;(3)估计待测的室内场景图像中的位于垂直方向和水平方向上的三个消失点,对于每个消失点等角度间隔的引出射线生成若干扇形区域;(4)对于每个消失点,根据预测布局边缘图中对应扇形区域的平均边缘强度最大准则和消失点类型选择一或两个扇形区域作为采样扇形区域;(5)对预测布局边缘图加高斯模糊,然后对采样扇形区域进行采样,由在采样扇形区域中从三个消失点引出的射线两两相交生成一系列布局候选项;(6)计算各布局候选项与预测布局边缘图的相似度,并选出与预测布局边缘图最为相似的布局估计作为最终的布局估计结果。2.根据权利要求1所述的一种基于条件生成对抗网络的室内场景布局估计方法,其特征在于,所述条件生成对抗网络中生成网络的反卷积部分由两个分支组成,第一个分支包括八层反卷积层,用于生成预测布局边缘图,第二个分支包括两层反卷积层,用于监督第一个分支工作,由第一个分支的第四层的输出结果经过两层反卷积后将输出结果大小设置成与预测布局边缘图的大小一致,然后两个结果一同输出。3.根据权利要求2所述的一种基于条件生成对抗网络的室内场景布局估计方法,其特征在于,所述条件生成对抗网络中生成网络的损失函数为:其中,其中,G*表示生成网络的损失函数,表示最大化判别网络D中输入数据分布与真实数据分布之间的差异,最小化生成网络G的输出数据分布与真实数据分布之间的差异。x表示输入的室内场景图像,z表示输入的随机噪声,x~px(x)表示x的数据分布,x,y~pdata(x,y)表示x和y的联合数据分布,z~pz(z)表示z的数据分布,G(x,z)表示生成网络的输出,y表示对应于x的真实边缘图,VcGAN(G,D)表示对抗损失函数,E表示求归一化期望值,VL2(G)表示L2损失函数,λ表示L2损失函数的权重,||·||符号表示取绝对值运算,VL2(Gd4)表示生成网络中监督部分的L2损失函数,η表示该网络部分的L2损失的权重,Gd4表示生成网络中反卷积部分第四层的输出结果通过两层反卷积网络后的输出结果。4.根据权利要求1所述的一种基于条件生成对抗网络的室内场景布局估计方法,其特征在于,步骤(3)中消失点的估计包括:(3.1)检测出室内场景图像中满足一定长度要求的线段,将检测出的线段集合记为{li},1≤i≤n,n为线段的数目,Pk为{li}中线段两两相交的形成第K个交点,即为候选消失点,1≤k≤K,K为{li}中线段两两相交的形成的交点数目,则第i个线段li对Pk的得分贡献为:其中,α表示li与Pk和li中点的连线之间的夹角,σ为鲁棒...
【专利技术属性】
技术研发人员:刘天亮,曹旦旦,戴修斌,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。