【技术实现步骤摘要】
一种基于图像的同时检测平面结构和生成平面描述的方法及应用
本专利技术涉及计算机视觉和图像处理领域,尤其涉及一种基于图像的同时检测平面结构和生成平面描述的方法及应用。
技术介绍
查找不同视图之间的对应关系是3D视觉任务,例如增强现实(AR)应用和基于图像的定位(IBL)或图像检索的关键问题。在AR应用程序中,某些虚拟对象通常放置在提取的平面上。传统的平面提取通常遵循以下范式:先进行特征点提取和描述(如SIFT,ORB,SuperPoint等),将匹配的特征点从多个视图中三角化为3D坐标点,然后通过对3D点进行聚类和扩展来估计平面的参数。但是,在具有挑战性的条件下(例如,弱纹理的场景)获得足够的匹配特征点并非易事。一些方法直接执行深度估计,然后对平面进行三角剖分,以便可以将虚拟对象放置在平面上,但它们不能区分语义上不同的区域。例如,墙壁和门可以具有相同的深度,并且将仅检测到一个平面,这不足以实现将帽子悬挂在门上的AR效果。人造场景通常包含丰富的平面结构,人类对世界的感知可能基于单个平面特征,而不是基于低级特征点或全局图像特征。诸如平面结构之类的中层特征可以在某种程度上模拟人类感知世界的方式。鉴于此,本专利技术强调平面检测和描述值得更多关注。基于图像的定位(IBL)任务也可认为是场景识别。基于图像的定位任务是:给定查询图像,从具有地理标记的数据库中的相同位置捕获的参考图像。现有作品可以分为基于图像检索的方法和基于按位置分类方法等,而本专利技术的关注点在于能够生成多个平面描述子,用于检索相似图像。传统的Net ...
【技术保护点】
1.一种基于图像的同时检测平面结构和生成对应平面描述的方法,其特征在于,包括:/n针对单张图像,利用平面检测和描述网络SuperPlane,生成图像的多个3D平面以及每个平面对应的描述子;/n所述的平面检测和描述网络SuperPlane包括平面检测子网络和平面描述子网络,所述的平面检测子网络由骨干网络和两个分支构成,第一分支采用Unet网络,第二分支包括区域生成网络RPN+RoIAlign层、卷积层、激活函数层构成;/n首先通过骨干网络提取图像特征,得到第一特征图;/n在第一分支中,利用Unet网络获取第一特征图的深度图;/n在第二分支中,利用区域生成网络RPN和RoIAlign层提取第一特征图中的局部区域信息,获得感兴趣区域;经卷积层提取感兴趣区域的特征,得到第二特征图,再经激活函数层输出每一个平面的分割蒙板图;/n由深度图和分割蒙板图合成3D平面;/n所述的平面描述子网络由掩码感知模块、卷积层、平均池化层、全连接层、内部正则化层和L2范数层构成;/n将由平面检测子网络输出的第二特征图和分割蒙板图进行逐个像素相乘,以获得掩码感知的第三特征图,然后将第三特征图与第二特征图拼接作为第四特 ...
【技术特征摘要】
1.一种基于图像的同时检测平面结构和生成对应平面描述的方法,其特征在于,包括:
针对单张图像,利用平面检测和描述网络SuperPlane,生成图像的多个3D平面以及每个平面对应的描述子;
所述的平面检测和描述网络SuperPlane包括平面检测子网络和平面描述子网络,所述的平面检测子网络由骨干网络和两个分支构成,第一分支采用Unet网络,第二分支包括区域生成网络RPN+RoIAlign层、卷积层、激活函数层构成;
首先通过骨干网络提取图像特征,得到第一特征图;
在第一分支中,利用Unet网络获取第一特征图的深度图;
在第二分支中,利用区域生成网络RPN和RoIAlign层提取第一特征图中的局部区域信息,获得感兴趣区域;经卷积层提取感兴趣区域的特征,得到第二特征图,再经激活函数层输出每一个平面的分割蒙板图;
由深度图和分割蒙板图合成3D平面;
所述的平面描述子网络由掩码感知模块、卷积层、平均池化层、全连接层、内部正则化层和L2范数层构成;
将由平面检测子网络输出的第二特征图和分割蒙板图进行逐个像素相乘,以获得掩码感知的第三特征图,然后将第三特征图与第二特征图拼接作为第四特征图;将第四特征图依次经卷积层、平均池化层、全连接层后生成矩阵,通过内部正则化层转换为向量,最后使用L2范数层进行整体归一化,得到每一个3D平面对应的描述子。
2.根据权利要求1所述的基于图像的同时检测平面结构和生成对应平面描述的方法,其特征在于,利用一个平面描述基准来训练网络,具体为:
获取图像对,采用PlaneRCNN生成的平面索引;每对图像样本都包含一组对应的匹配项、图像对之间的相对位姿和相机内参,所述的匹配项为平面索引-平面索引,构成三元组;
构建平面基准,通过相对位姿将图像对中的一张图像扭曲到另一张图像,然后计算交集IOU,来选择三元组,筛选出IOU值处于0.4-0.7的三元组作为训练集。
3.根据权利要求2所述的基于图像的同时检测平面结构和生成对应平面描述的方法,其特征在于,在训练过程中引入循环扭曲优化网络,根据两张视图对应的深度图进行优化,具体为:
将第一张视图中的3D点Pc利用相对姿态信息投影到第二张视图中,然后利用双线性插值从第二张视图中读取对应的3D点Pn;利用拍摄不同视角的相机姿态,将Pn转换到第一张视图的坐标系,并计算转换后的坐标与转换前的坐标Pn之间的3D距离;
将第二张视图中的3D点Pn利用相对姿态信息投影到第一张视图中,然后利用双线性插值从第一张视图中读取对应的3D点Pc;利用拍摄不同视角的相机姿态,将Pc转换到第一张视图的坐标系,并计算转换后的坐标与转换前的坐标Pc之间的3D距离;
通过保持两张图像之间重建的3D平面的一致性来提升平面检测和深度估计的质量。
4.根据权利要求3所述的基于图像的同时检测平面结构和生成对应平面描述的方法,其特征在于,两张不同视角的视图需存在交叠,且两张视图的相对姿态、拍摄不同视角的相机姿态已知。
5.根据权利要求3所述的基于图像的同时检测平面结构和生成对应平面描述的方法,其特征在于,在训练过程中引入平面实例级三重态损失,随机选择一...
【专利技术属性】
技术研发人员:鲍虎军,章国锋,叶伟才,
申请(专利权)人:浙江大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。