用于借助多任务学习确定对象在对象的周围环境中的姿势的方法和控制设备技术

技术编号：25353412 阅读：31 留言：0更新日期：2020-08-21 17:11

本发明专利技术涉及一种用于确定对象在其周围环境中的姿势的方法，其中借助光学采集设备来采集对象以及其周围环境作为当前图像(x

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于借助多任务学习确定对象在对象的周围环境中的姿势的方法和控制设备
本专利技术涉及一种用于确定对象在其周围环境中的姿势的方法。借助光学采集设备来采集对象以及其周围环境作为当前图像，并且借助光学图像分析来确定对象的姿势。借助神经网络将姿势确定为神经网络的输出。借助通过姿势回归和描述符学习的多任务学习来训练神经网络，该描述符学习通过使用三元组损失函数(Triplet-wise-Loss-Funktion)和成对损失函数(Pair-wise-Loss-Funktion)来确定。此外，本专利技术涉及一种控制设备。
技术介绍
在计算机视觉领域中，对对象的姿势的确定已经是已知的。例如，可以借助2D视图专用模板(2D-View-spezifischeVorlage)来执行对象识别和姿势估计。通过针对一组已知的视图来计算手动产生的属性表示，可以为具有未知类别和姿势的给定模板找到最相似的对应。同样已知，使用基于学习的方法来面对该问题，而不是依赖于手动产生的属性，从而能够推断出更多描述性和鲁棒性的属性表示来查询对象位置。例如，Kehl等人的“DeepLearningofLocalRGB-DPatchesof3DObjectDetectionand6DPoseEstimation，3D对象识别和6D姿势估计的局部RGB-D补丁的深度学习”描述了自动编码器的使用以便学习针地RGB-D图像补丁的属性描述符(Eigenschafts-Deskriptor)。Wohlhart和Lepetit在他们的公开“LearningD...

【技术保护点】
1.一种用于确定对象在其周围环境中的姿势的方法，其中借助光学采集设备来采集对象以及其周围环境作为当前图像(x

【技术特征摘要】
【国外来华专利技术】20180111 EP 18151255.91.一种用于确定对象在其周围环境中的姿势的方法，其中借助光学采集设备来采集对象以及其周围环境作为当前图像(xi)，并且借助光学图像分析来确定对象的姿势，并且其中借助神经网络(1)将对象的姿势确定为所述神经网络(1)的输出，其中借助通过使用姿势回归(Lpose)和描述符学习(Ld)的多任务学习(LMTL)来训练所述神经网络(1)，所述描述符学习通过使用三元组损失函数(Ltriplet)和成对损失函数(Lpair)来确定，
其特征在于，
所述姿势回归(Lpose)借助四元数来确定，所述三元组损失函数(Ltriplet)依据动态裕度项(m)来确定并且所述成对损失函数(Lpair)仅作为锚定函数来确定。

2.根据权利要求1所述的方法，其中通过确定对象的姿势来识别对象类型和/或确定对象相对于对象的周围环境的位置。

3.根据上述权利要求中任一项所述的方法，其中在所述姿势回归(Lpose)中将到所述神经网络(1)的输入x映射到较低维度的属性向量f(x)∈Rd。

4.根据上述权利要求中任一项所述的方法，其中为了学习所述三元组损失函数(Ltriplet)，确定与当前图像(xi)相对应的锚图像(si)并且选择拉图像(sj)，使得对象的当前图像(xi)与对象的具有相似姿势的图像相对应。

5.根据上述权利要求中任一项所述的方法，其中为了学习所述三元...

【专利技术属性】
技术研发人员：M布伊，S扎卡罗夫，S阿尔巴库尼，S伊利克，
申请(专利权)人：西门子股份公司，
类型：发明
国别省市：德国;DE

全部详细技术资料下载我是这个专利的主人