【技术实现步骤摘要】
【国外来华专利技术】用于处理图像和确定对象的视点的方法和系统
本公开涉及图像处理领域,并且更确切地涉及图像上三维对象的检测。
技术介绍
已经提出了在由相机获取的图像上检测三维对象。通常,还希望获得图像上可见对象的6D姿态。“6D姿态”是本领域技术人员众所周知的指定对象的三维位置和三维方向的组合的表达。检测对象的已知方法并不令人满意。例如,已知方法可能要求使用深度信息(例如,使用本领域技术人员称为“RGB-D”或“RGB-Depth”的图像)。已知方法也可能无法检测到特定对象,诸如具有麻烦的几何形状或纹理的对象,或者甚至小对象。一些方法提供关于视点(在图像上看到对象的角度)或6D姿态的非常粗糙的信息。例如,一些方法仅指示从侧面或下方看到对象。因此,需要改进的方法以处理图像,尤其是检测对象及其视点。从现有技术中,已知以下文献:-A.Mousavian、D.Anguelov、J.Flynn和J.Kosecka。“3DBoundingBoxEstimationUsingDeepLearningandGeometry(使用深度学习和几何的3D边界框估计)”。arXiv:1612.00496,2016。-P.Poirson、P.Ammirato、C.-Y.Fu、W.Liu、J.Kosecka和A.C.Berg。“FastSingleShotDetectionandPoseEstimation(快速单发检测和姿态估计)”。In3DV,2016。-W.Liu、D.Anguelov、D.Er ...
【技术保护点】
1.一种用于处理图像的方法,所述方法包括将所述图像输入到神经网络(1),所述神经网络被配置成:/n获得(2)多个特征图(4a、…、4f),每个特征图具有相应的分辨率和相应的深度,/n对每个特征图执行(3)分类,以对于每个特征图,实现:/n-在所述图像上可见的至少一个对象的类型,/n-围绕所述至少一个对象的至少一个二维边界框的所述图像中的位置和形状,/n-对于所述至少一个对象的至少一个可能的视点,/n-对于所述至少一个对象的至少一个可能的面内旋转。/n
【技术特征摘要】
【国外来华专利技术】1.一种用于处理图像的方法,所述方法包括将所述图像输入到神经网络(1),所述神经网络被配置成:
获得(2)多个特征图(4a、…、4f),每个特征图具有相应的分辨率和相应的深度,
对每个特征图执行(3)分类,以对于每个特征图,实现:
-在所述图像上可见的至少一个对象的类型,
-围绕所述至少一个对象的至少一个二维边界框的所述图像中的位置和形状,
-对于所述至少一个对象的至少一个可能的视点,
-对于所述至少一个对象的至少一个可能的面内旋转。
2.根据权利要求1所述的方法,其中,所述图像是彩色图像,或者是彩色和深度图像。
3.根据权利要求1或2所述的方法,其中,借助于内核感知器(3)执行所述分类。
4.根据权利要求1至3中的任意一项所述的方法,其中,获得多于两个特征图,或者获得六个特征图(4a、…、4f),所述特征图每个都具有不同的分辨率。
5.根据权利要求1至4中的任意一项所述的方法,进一步包括使用用于至少一个对象的所述至少一个可能的视点,以及用于所述至少一个对象的所述至少一个可能的面内旋转,来获得所述至少一个对象的6D姿态。
6.根据权利要求5所述的方法,其中,获得所述6D姿态进一步包括使用基于颜色的方法、或者基于轮廓的方法、或者基于深度的方法来改善所述6D姿态。
7.根据权利要求1至6中的任意一项所述的方法,进一步包括所述神经网络的初步训练,所述初步训练包括输入模板图像,其中,至少一个三维模板对象已被渲染到所述神经网络。
8.根据权利要求7所述的方法,其中,所述初步训练进一步包括:
使用所述神经网络,获得:
-在所述模板图像上可见的至少一个模板对象的类型,
-围绕所述至少一个对象的至少一个二维边界框的所述模板图像中的位置和形状,
-对于所述至少一个模板对象的至少一个可能的视点,
-对于所述至少一个模板对象的至少一个可能的面内旋转,
并且在以下等式中最小化L:
其中:
Pos表示具有包围模板对象的预定义部分面积的面积的所述边界框,
Neg表示具有不包围模板对象的预定义部分面积的面积的所述边界框,
b是属于Pos或Neg的边界框,
Lclass是与归因于分类的误差相关联的损...
【专利技术属性】
技术研发人员:斯文·迈尔,诺里马萨·科博里,瓦迪姆·克尔,法比安·曼哈特,费德里科·汤巴里,
申请(专利权)人:丰田自动车欧洲公司,
类型:发明
国别省市:比利时;BE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。