体积识别方法和系统技术方案

技术编号:5517786 阅读:249 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及体积识别方法,其包括以下步骤:a)使用3D成像系统(3)来捕获三维图像数据,其中,所述图像数据呈现出多个点(5),每个点(5)具有在三维空间中的至少一组坐标;b)将所述点(5)中的至少一些点群组化为一组丛集(6);c)根据诸如位置和尺寸的第一组参数来选择与位于所述成像系统(3)的范围内的目标对象(1)对应的丛集(6);d)根据包括所述点(5)在所述三维空间中的位置的第二组参数,来将所选择的丛集(6)的点(5)中的至少一些点群组化为一组子丛集,其中,每个子丛集在所述三维空间中具有形心(11);以及e)将体积(12)与至少一些所述子丛集中的每一个相关联,其中,所述体积(12)被固定到所述子丛集的形心(11)。本发明专利技术还涉及用于执行上述方法的体积识别系统。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及体积识别方法和系统,特别是与数据处理装置互动交互的体积识别方法和系统,但不局限于此。
技术介绍
与数据处理系统的交互,且特别是数据与指令的输入,是一般性的习知议题。传 统上,这种交互会通过实体输入装置,例如键盘、鼠标、滚轮、笔、触摸屏、操纵杆、游戏键盘 等等,以响应使用者对于它们所进行的实体动作而产生信号。然而,此种实体输入装置具 有许多缺点。例如,他们仅能提供有限的不同输入信号量,在某些应用,例如三维"虚拟现 实"环境中,会让人觉得不自然且缺乏真实感。此外,这些装置很容易受到磨损的影响, 且这些装置的持续使用可能甚至会对使用者的健康造成负面的影响,例如重复性的拉伤 (repetitive strain injury)。 也已知道有替代性的输入装置及方法。例如,针对语音识别的实用系统可供使用。 然而,对某些应用而言,例如需要使用者快速、精确且反复输入的动作游戏,语音识别并非 实用的选择方案。此外,其效果很不幸地会受到背景噪声的影响,而且其通常需要学习时段 来识别特定使用者的语音命令。另外的选择方案是图像识别。在其最简单的形式中,图像 识别系统能以对比色彩来识别二进制图样,例如条形码,且将这些图样转换成用于处理的 二进制信号。较高级的图像识别系统能够识别图像中更复杂的图样,且在响应时产生非常 多样的信号。例如,美国专利US 6256033已经提出了这种图像识别系统,用于在成像系统 的范围内识别使用者的姿态。然而,传统的成像系统对于深度不具有识别力,且仅能产生该 使用者的2D投影。其结果是,使得使用者的姿态的识别在本质上就有缺陷,受限于可行的 输入的范围,且充斥着可能的识别错误。特别是这些系统会有使使用者与其背景分离的问 题。 然而,3D成像系统的发展提供了发展形状识别方法及装置的可能性,允许例如,更 好的使用者姿态识别。在G. Yahav、 G. J. Iddam与D. Mandelboum的"3D Imaging Camera for Gaming A卯lication"中公开了一种这样的3D成像系统。在此论文中公开的该3D成 像系统就是所谓的"飞行时间式(Time-0f-Flight)"或T0F型,其能够从位于前述3D成像 系统的范围内的对象所反射的光的波前(wavefront)的形状来获得深度感知。然而,例如 立体照相机(stereo camera)、激光雷达(LIDAR)、雷达、声纳等等也已经提出了其它种类的 成像系统。 使用这种3D成像系统的姿态识别方法及系统已被公开在国际专利申请案W0 00/30023A1中。然而,因为此方法本身不会识别体积,而是仅能反映出在某个目标区域中的 对象的点是否存在以及在区域中的移动,其仅能识别最简单的姿态,且在更复杂的应用方 面依然不适用。在W02004/064022A1中,公开了更基本的输入方法。 美国专利申请案公开案US 2006/023558A1公开了一种使用3D成像系统的形状识 别方法。在此方法中,根据所见的深度来将前述3D图像的点群组化为丛集(cluster)或"块(blob)"。然后,使预先定义的对象的不同形状的基元(primitive)可以和这些"块(blob)" 相关联。当此体积识别方法允许对在前述3D成像系统的范围内的对象进行更精确的建模 时,其仍然会有明显的缺点。当在前述图像中的所有对象被分配成一个"块(blob)"时,其 数量及复杂度将会受限于可用的数据处理能力。实际上,这会将此形状识别方法限制于仅 需要对象的低阶模型的应用,例如车辆撞击警示及回避系统。在需要较精密的体积识别的 应用中,例如姿态识别系统,前案依旧是不实用的。 美国专利申请公开案US 2003/0113018A1以及国际专利申请案W003/071410A2两 者皆公开了更适合用于姿态识别的形状识别方法。 在US 2003/0113018A1所公开的方法中,使用者是最接近前述3D成像系统的对 象,且欲略过背景,则选择出比预定深度阈值更接近的前述3D图像的点。然后,根据数个 不同的基准及群组化算法,前述被选择的点会被群组化为呈现前述躯干、头部、臂部、手部 的五个丛集。然后,使前述躯干和臂部与平面形状相关,且使前述头部和手部与三维体积相 关。当此方法容许更高级的姿态识别时,前述体积识别会保持较低阶,尤其是前述躯干及臂 部被识别为平面状,而非三维元素。 在W0 03/071410A2所公开的方法中,公开了一种体积识别方法,其中根据所见3D 图像的点的深度来将前述3D图像的点群组化为丛集,如同在US 2006/023558A1中,选择代 表目标对象(例如手部)的这些丛集中的一个。然后,藉由该被选择的丛集的点的特征的 统计分析及与预先建立的图样之间的比较来识别姿态。虽然比起上述的其它现有技术,此 方法更为有力,但针对无缝整合识别(seamless recognition)时,其将会需要相当可观的 图样库。
技术实现思路
因此,本专利技术所解决的问题在于提供一种方法及系统,能够快速地以较精密且细 致的方式,来识别位于3D成像系统的范围内的目标对象的体积,因而最后能够通过姿态识 别来与数据处理系统进行较简单且较精确的交互。 本专利技术的体积识别方法通过以下步骤来解决这个问题根据包含点在三维空间中 的位置的第二组参数,来将根据诸如位置和尺寸的第一组参数选择的且与位于该成像系统 的范围内的目标对象对应的丛集的至少一些点群组化为一组子丛集,其中,每个子丛集在 三维空间中具有形心;以及将体积与至少一些该子丛集中的每一个相关联,其中,该体积被 固定到该子丛集的形心。 通过这些步骤,本专利技术的体积识别方法提供了由与该子丛集相关联的体积所形成 的前述目标对象的相当精确的三维模型,且不会占用庞大处理功率。尽管是在相当地精确 时,依然能使用前述子丛集的形心的位置和相关联的体积的维度来表达此三维模型,因而 针对与数据处理系统的交互来促进前述三维模型的进一步处理,例如通过姿态识别。 另外有利的是,可以使用K-means算法来将前述被选择的丛集的点群组化为预定 数目为K的子丛集。使用K-means算法提供了一种能够快速且有效地将前述点群组化为预 定数目的子丛集的方法。 有利的是,与子丛集相关联的前述体积是球体,优选地以该子丛集的形心为中心。 在容许良好的体积识别时,能够使用半径作为唯一的参数来表达此形状的特征,因而进一步减少表达前述目标对象的三维模型的数据集合的大小。 另外有利的是,可根据包括以下步骤的方法来执行将点群组化为丛集 a)创建包含第一点的第一丛集;以及 b)对每个其它点执行以下操作 i)在三维空间中寻找形心最接近于所述其它点的丛集;以及 ii)如果在所述三维空间中在所述其它点和所述最接近的丛集的形心之间的绝对 距离高于预定阈值e ,并且丛集的数量仍然低于预定最大值q时,则创建包含所述其它点 的额外丛集;或者 iii)如果所述绝对距离不高于所述预定阈值9 ,或者丛集(6)的数量已经达到所 述预定最大值q时,则将所述其它点增加到形心最接近于所述其它点的所述丛集。 此方法确保将图像数据的点群组化为一组丛集的快速且有效的方法,每个丛集对 应于在三维空间中的不同的对象(包括前述目标对象)本文档来自技高网
...

【技术保护点】
一种体积识别方法,包括以下步骤:a)使用3D成像系统(3)来捕获三维图像数据,其中,所述图像数据呈现出多个点(5),每个点(5)具有在三维空间中的至少一组坐标;b)将所述点(5)中的至少一些点群组化为一组丛集(6);以及c)根据诸如位置和尺寸的第一组参数来选择与位于所述成像系统(3)的范围内的目标对象(1)对应的丛集(6);该方法的特征为更包括以下步骤:d)根据包括所述点(5)在所述三维空间中的位置的第二组参数,来将所选择的丛集(6)的点(5)中的至少一些点群组化为一组子丛集,其中,每个子丛集在所述三维空间中具有形心(11);以及e)将体积(12)与至少一些所述子丛集中的每一个相关联,其中,所述体积(12)被固定到所述子丛集的形心(11)。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:G皮诺J罗伊L德梅特X巴埃莱
申请(专利权)人:索夫特基奈蒂克股份公司
类型:发明
国别省市:BE[比利时]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1