3D检测和跟踪管线推荐的方法和计算机可读介质技术

技术编号：23768343 阅读：21 留言：0更新日期：2020-04-11 21:04

3D检测和跟踪管线推荐的方法和计算机可读介质。提供了预测用于对象检测、姿态估计和对象跟踪的管线的性能的系统和方法。在一个实施方式中，存储多个回归元，其中各个回归元可被训练用于特定对象检测OD、姿态估计PE和/或跟踪管线，以使得各个回归元响应于作为输入的第一特征向量而输出等于或大于另一回归元的得分，第一特征向量对应于相比其它管线更适合于特定管线的第一对象。第二特征向量与第二对象对应地存储。回归元以第二特征向量作为输入来运行以推导相应得分，并且相对于第二对象基于所推导的得分来指示至少一个管线的推荐。然后，可使用所指示的至少一个管线来执行OD/PE/跟踪。

Recommended methods and computer-readable media for 3D detection and tracking of pipelines

全部详细技术资料下载

【技术实现步骤摘要】
3D检测和跟踪管线推荐的方法和计算机可读介质
本公开总体上涉及图像数据流中的对象检测和姿态估计的领域，更具体地，涉及包括图像数据流中的低特征对象检测和姿态估计的增强现实系统。
技术介绍
随着计算机技术的进步，增强现实(AR)已变得越来越常见。AR的一般定义是捕获真实世界场景并使用软件添加人工(虚拟)元素。这可增强用户对真实世界的感知或向用户提供娱乐。在许多AR实现中对象跟踪是重要的。这意味着真实世界对象“跟随”有诸如计算机图形增强或信息泡泡(由用户感知)的人工对象。换言之，如果真实世界对象移动或者用户的视角相对于真实世界对象移动，则人工对象将相对于真实世界对象保持在相同的位置和/或将基于真实世界对象的移动和/或新位置来确定人工对象的内容。在许多AR实现中位置跟踪也是重要的。这意味着虚拟对象将停留在场景中的一个位置，而不管用户的移动。用于实现AR的一个平台是智能电话。相机、显示装置和处理器存在于相同的装置上允许软件容易地向相机所捕获的实时场景添加人工元素。此外，软件利用这些装置上的运动传感器和定位器(例如，加速度计和GPS)的存在来更好地实现AR。为了改进AR体验，透明头戴式显示器(HMD)可实现AR。这些系统通常是在眼睛前方放置具有棱镜的眼镜。用户直接通过眼镜来观看场景。棱镜允许人工图像叠加在用户所感知的场景上。此外，HMD使用相机从场景收集数据。为了创建AR环境，AR软件开发者可使用各种对象的样本图像数据来训练处理器。给定适当工具来创建AR环境，AR软件开发者可开发可利用真实世界场景...

【技术保护点】
1.一种存储用于3D检测和跟踪管线推荐的指令的非暂时性计算机可读介质，所述指令使得一个或更多个处理器能够：/n基于(i)测试对象的训练输入数据集和(ii)第一性能数据集来训练第一回归元，以使得当所述训练输入数据集输入时所述第一回归元输出近似于所述第一性能数据集的数据，/n其中，所述第一性能数据集基于各个测试对象的第一姿态和基准姿态，各个测试对象的所述第一姿态从姿态推导装置获得，该姿态推导装置运行第一管线以基于对应训练输入数据集以及由相机捕获的各个测试对象的图像来推导所述第一姿态，并且/n基于(iii)所述测试对象的所述训练输入数据集和(iv)第二性能数据集来训练第二回归元，以使得当所述训练输入数据集输入时所述第二回归元输出近似于所述第二性能数据集的数据，/n其中，所述第二性能数据集基于各个测试对象的第二姿态和所述基准姿态，各个测试对象的所述第二姿态从所述姿态推导装置获得，所述姿态推导装置运行第二管线以基于对应训练输入数据集以及由所述相机捕获的各个测试对象的图像来推导所述第二姿态。/n

【技术特征摘要】
20181001 US 16/148,6151.一种存储用于3D检测和跟踪管线推荐的指令的非暂时性计算机可读介质，所述指令使得一个或更多个处理器能够：
基于(i)测试对象的训练输入数据集和(ii)第一性能数据集来训练第一回归元，以使得当所述训练输入数据集输入时所述第一回归元输出近似于所述第一性能数据集的数据，
其中，所述第一性能数据集基于各个测试对象的第一姿态和基准姿态，各个测试对象的所述第一姿态从姿态推导装置获得，该姿态推导装置运行第一管线以基于对应训练输入数据集以及由相机捕获的各个测试对象的图像来推导所述第一姿态，并且
基于(iii)所述测试对象的所述训练输入数据集和(iv)第二性能数据集来训练第二回归元，以使得当所述训练输入数据集输入时所述第二回归元输出近似于所述第二性能数据集的数据，
其中，所述第二性能数据集基于各个测试对象的第二姿态和所述基准姿态，各个测试对象的所述第二姿态从所述姿态推导装置获得，所述姿态推导装置运行第二管线以基于对应训练输入数据集以及由所述相机捕获的各个测试对象的图像来推导所述第二姿态。

2.根据权利要求1所述的非暂时性计算机可读介质，该非暂时性计算机可读介质还被配置用于存储指令，所述指令使得所述一个或更多个处理器能够：
将所述第一回归元和所述第二回归元存储在软件开发包SDK的训练工具中以用于帮助应用开发者开发增强现实应用。

3.根据权利要求1所述的非暂时性计算机可读介质，该非暂时性计算机可读介质还被配置用于存储指令，所述指令使得所述一个或更多个处理器能够：
基于(v)所述测试对象的所述训练输入数据集和(vi)第三性能数据集来训练不同于所述第一回归元和所述第二回归元的至少一个附加回归元，以使得当所述训练输入数据集输入时所述附加回归元输出近似于所述第三性能数据集的数据，
其中，所述第三性能数据集基于各个测试对象的第三姿态和所述基准姿态，各个测试对象的所述第三姿态从所述姿态推导装置获得，所述姿态推导装置运行第三管线以基于对应训练输入数据集以及由所述相机捕获的各个测试对象的图像来推导所述第三姿态。

4.根据权利要求1所述的非暂时性计算机可读介质，其中，当目标对象的训练数据被输入到所述第一回归元和所述第二回归元时，所述第一回归元和所述第二回归元输出表示所述第一管线和所述第二管线之一的推荐的数据以用于检测所述目标对象、估计所述目标对象的姿态和/或跟踪所述目标对象的姿态。

5.根据权利要求1所述的非暂时性计...

【专利技术属性】
技术研发人员：A·M·罗滕施泰因，A·K·贝科，C·M·苏坦托，孙佳宁，A·S·克尔曼，
申请(专利权)人：精工爱普生株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人