一种无标记的增强现实多目标注册跟踪方法技术

技术编号：18594030 阅读：36 留言：0更新日期：2018-08-04 20:16

本发明专利技术公开了一种无标记的增强现实多目标注册跟踪方法，包括：1)离线阶段：通过分层k‑means聚类出词汇树模型，并为词汇树所有叶子节点的倒排索引注册对应的图像id，最后根据整棵树的叶子结点出现的频数和总共的待注册图像数更新为一棵带tf‑idf的词汇树；2)在线阶段：在线阶段是一个实时响应的系统，对摄像头实时输入的图像，根据训练好的词汇树，检索出最相似的图像，随后通过相机的位姿估计计算出待加载的3D物体初始位姿，并采用KLT的跟踪算法对此目标的运动进行跟踪，最后通过渲染线程搭建各目标的增强现实场景。本发明专利技术为无标记的多目标增强现实提供了高效、可靠的解决方案。

A markup less augmented reality multi target registration tracking method

The invention discloses an unmarked augmented reality multi-objective registration and tracking method, including: 1) off-line phase: clustering the vocabulary tree model by hierarchical K means, and registering the corresponding image ID for all the leaf nodes of the vocabulary tree, and finally the frequency and total registration according to the leaf node of the whole tree. The number of images is updated to a word tree with TF IDF; 2) online phase: the online phase is a real-time response system. The real-time input image of the camera, the most similar images are retrieved according to the trained vocabulary tree, and then the initial pose of the 3D object to be loaded is calculated by the position estimation of the camera, and KLT is used. The tracking algorithm tracks the movement of the target, and finally builds up the augmented reality scenes of the targets through the rendering thread. The invention provides an efficient and reliable solution for unmarked multi-target augmented reality.

全部详细技术资料下载

【技术实现步骤摘要】
一种无标记的增强现实多目标注册跟踪方法
本专利技术涉及计算机图形学领域，尤其是指一种无标记的增强现实多目标注册跟踪方法。
技术介绍
增强现实是将虚拟世界和现实世界的信息无缝融合起来的技术，把原本超出现实世界中的体验信息通过电脑等科学技术，进行模拟仿真叠加在现实世界中，从而达到超越现实的感官体验，增强现实可作用于视觉、听觉以及味觉等感觉系统中。增强现实的起源可追溯于计算机技术的诞生，1968年哈弗大学电气工程副教授萨瑟兰专利技术的头戴式显示设备是增强现实的原型机，整套系统将显示设备放置在用户头顶的天花板，并通过连接杆和头戴设备相连，能够将简单线框图转换为3D效果的图像。本专利技术所涉及到的增强现实应用场景以视觉系统为主，传统的基于标记的增强现实技术已经跟不上时代的脚步，满足不了人们丰富的多元化世界需求，无标记的增强现实技术更为灵活，具有普遍适用性。本专利技术阐述了无标记的多目标增强现实注册跟踪所运用到的技术，主要包括视觉特征聚类，词汇树模型，倒排索引，摄像机位姿估计，目标跟踪等算法。21世纪，有大量的公司着手于增强现实的应用开发，所用到的开发平台由以下几个为主：(1)Vuforia；(2)EasyAR；(3)Wikitude；(4)ARToolKit；(5)Maxst；(6)Xzimg；以及苹果公司早期收购的Metaio公司，并于2017年6月发布了IOS系统的ARkit开发包供用户使用。其中，除了ARToolKit外，其他几个平台都只提供开放接口供用户进行应用开发，并且超出一定的限制后需要收费。虽然商业化的开放平台提供了较为完善的解决方案，但无法为研究员提...

【技术保护点】
1.一种无标记的增强现实多目标注册跟踪方法，其特征在于，包括以下步骤：1)离线阶段：通过分层k‑means聚类出词汇树模型，并为词汇树所有叶子节点的倒排索引注册对应的图像id，最后根据整棵树的叶子结点出现的频数和总共的待注册图像数更新为一棵带tf‑idf的词汇树；2)在线阶段：在线阶段是一个实时响应的系统，对摄像头实时输入的图像，根据1)中训练好的词汇树，检索出最相似的图像，随后通过相机的位姿估计计算出待加载的3D物体初始位姿，并采用KLT的跟踪算法对此目标的运动进行跟踪，最后通过渲染线程搭建各目标的增强现实场景。

【技术特征摘要】
1.一种无标记的增强现实多目标注册跟踪方法，其特征在于，包括以下步骤：1)离线阶段：通过分层k-means聚类出词汇树模型，并为词汇树所有叶子节点的倒排索引注册对应的图像id，最后根据整棵树的叶子结点出现的频数和总共的待注册图像数更新为一棵带tf-idf的词汇树；2)在线阶段：在线阶段是一个实时响应的系统，对摄像头实时输入的图像，根据1)中训练好的词汇树，检索出最相似的图像，随后通过相机的位姿估计计算出待加载的3D物体初始位姿，并采用KLT的跟踪算法对此目标的运动进行跟踪，最后通过渲染线程搭建各目标的增强现实场景。2.根据权利要求1所述的一种无标记的增强现实多目标注册跟踪方法，其特征在于，在步骤1)中，离线阶段包括以下步骤：a)为待注册的图像集提取所有的SIFT特征点描述子；b)根据词汇树的分支数进行k-means分层聚类；c)依次为每一个分支下所有的SIFT特征点描述子重复b)的操作，直到叶子节点为止；d)最终为最底层的所有叶子节点分别链接一个倒排索引文件；e)重新为待注册的图像，提取SIFT特征点描述子，为每个特征点描述子根据训练的词汇树统计其在各叶子节点上的得分权重并为对应图像进行注册；f)根据整棵树叶子节点上倒排索引文件长度，重新计算带tf-idf权重的词汇树；设总共注册的图像数为N，对任一叶子节点i，共有Ni张图像注册到其倒排索引上，则此叶子节点i的tf-idf权重为对于已注册的图像d，若有mi个特征点落入到叶子节点i上，则此叶子节点的得分为di＝miwi，对于待检索的图像q，若有ni个特征点落入到叶子节点i上，则此叶子节点的得分为qi＝niwi。3.根据权利要求1所述的一种无标记的增强现实多目标注册跟踪方法，其特征在于，在步骤2)中，整个系统拥有一个识别线程、多个跟踪线程、一个渲染线程，具体情况如下：多目标追踪的表述形式：给定一组图像序列{I1,I2,...,It}，每幅图像中的目标个数为Mt，每个目标的状态有位置，姿态等信息，由一个3×4的矩阵表示，如下式：其中包括了一个3×3的旋转矩阵R和一个3×1平移矩阵t,一个世界坐标系的3D点能通过以下方程映射得到相机坐标系的2D点位置：其中u，v为相机投影的图像坐标系；xw，yw，zw为一个特征点的世界坐标系坐标；A为相机的内部参数，如下式：式中，∝x和∝y代表焦距，cx和cy代表主点的坐标，s代表倾斜系数，这些属于摄像机的内在参数，用来纠正光学形变的影响，能够在离线阶段完成；位姿估计就是通过n≥3个参考点的视角，计算出一个精准的摄像机外在参数st，用ICP迭代法计算出位姿矩阵R和t；那么每幅图像中所有目标状态表示为对应着第i个目标的运动轨迹表示为所有图像目标组成的状态序列S1:t＝{S1,S2,...,St}；识别线程的工作内容：与传统的单目标识别相比，多目标识别旨在尽可能多地识别出图像中的目标，设It中包含n个目标，步骤流程如下：a)根据摄像头的输入图像It，首先利用SIFT算法检测所有的特征点集合P，并为特征点集合P提取所有的SIFT特征点描述子；b)根据离线阶段训...

【专利技术属性】
技术研发人员：张宇，卢明林，李雯，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人