The present invention in an interactive method and object tracking hand short baseline stereo imaging based on its main contents include: scene modeling, graph modeling, model evaluation and identification of stochastic optimization, the process is, firstly the input color image stereo pairs hand recognition, graph calculation, and then hand modeling with skin the texture of the parameters in the model based on particle swarm algorithm based on the calculation and its regional continuity according to the evaluation results of arrangement, the highest scoring model for prediction and tracking, and add it into the actual scene in the projection. The method can handle the hand modeling with different degrees of bending and posture, and provides a parameter solving method based on particle swarm optimization, which can accurately and effectively track the hand and its objects.
【技术实现步骤摘要】
一种基于短基线立体成像的人手及其对象交互跟踪方法
本专利技术涉及肢体动作分析领域,尤其是涉及了一种基于短基线立体成像的人手及其对象交互跟踪方法。
技术介绍
在计算机视觉领域中,人类手部动作与姿态的三维视图恢复具有重要的意义。人们无论在与物理世界打交道或者是与人类沟通都需要一直用到手部,并且使用方式多样且各不相同。因此,一种准确、稳健且实时的对于手部动作分析与跟踪的方法对人类来讲有重要影响,并且在许多领域有巨大的商业潜力或实用价值,例如物联网的人机交互、医学肢体康复、手语动作分析等,都亟待开发研究。此外,在安检领域的手持物体姿态分析、指挥系统的远程手势识别、智能机器人的拟人仿真及替代人类在危险或不适工作环境中的动作设计等方面都有极大应用前景。三维手部姿态的跟踪仍然具有挑战性。由于形状复杂、细节丰富、姿势多变,对手型的建模并不容易。同时在细节方面,因为多关节结构的不确定性及其长短程度的不统一性,在取景时往往出现模糊不清的姿势和自遮挡的现象,并且动作的急缓、轻重也对姿态的建模带来不良影响,因此在对手型建模的脉络填充过程带来困难。本专利技术提出了一种基于随机优化求解最优参数的新框架。对输入成对人手立体彩色图像进行辨识度匹配图的计算,然后进行带皮肤质地的人手建模,在基于粒子群算法的基础上求解模型的参数,并且计算其区域延续性按评价结果排列,得分最高的模型用于预测跟踪,并叠加到实际场景中进行投影。本专利技术可以处理不同程度弯曲和姿态的手型建模,提供了基于粒子群算法的参数求解方法,准确并有效地对人手及其对象交互进行跟踪。
技术实现思路
针对解决在复杂场景中进行人手及其对象跟踪 ...
【技术保护点】
一种基于短基线立体成像的人手及其对象交互跟踪方法,其特征在于,主要包括场景建模(一);辨识图建模(二);模型评价(三);随机优化(四)。
【技术特征摘要】
1.一种基于短基线立体成像的人手及其对象交互跟踪方法,其特征在于,主要包括场景建模(一);辨识图建模(二);模型评价(三);随机优化(四)。2.基于权利要求书1所述的场景建模(一),其特征在于,给定输入的成对立体彩色人手图像,1)使用人手特征数据库自动并可视化地仿真人手,使用22根骨头进行对右手带有皮肤特质的模拟,同时,对该仿真右手进行类似血脉的网丝状物填充,共相互连接1491个节点,并且该手腕具有26个自由度;每只手由27个参数控制,分别为:3个参数表征手的位置、4个参数用于四次元数表征手体转动以及五根手指各使用4个参数表征弯曲角度;2)对于与人手交互作用的对象其场景建模则使用7个参数,3个参数表征对象位置及4个参数用于四次元数表征对象转动,该对象具有6个自由度;综上,可用多维度数组管理所有参数用于建立独特的人手及其对象模型。3.基于权利要求书1所述的辨识图建模(二),其特征在于,包括辨识度划分和适度响应分类和辨识度统计。4.基于权利要求书3所述的辨识度划分,其特征在于,根据信息论中不确定熵含有信息量大于确定熵的原理,在检查彩色图像中颜色的延伸性可用此原理测定仿真性程度,具体为:对于图像中的每个像素p,使用局部自相关公式计算以其为中心的近邻B×B的主曲率λ1和λ2,同时不失一般性,假设λ1≥λ2且B=3,当λ1和λ2都处于较小值时说明颜色区域较为统一,当λ1和λ2都较大时说明出现颜色的拐角,而当λ1比λ2要大得多时,则说明像素p的近邻是边缘区域,因此辨识度可用哈里斯角点检测方程定义为:ch=λ1·λ2-k(λ1+λ2)2(1)其中,k标准取值为0.04。5.基于权利要求书3所述的适度响应建立,其特征在于,对于不同的颜色延续性给予不同的响应,即对于像拐角的像素区域给予低响应,对像边缘的像素区域给予高响应,对均衡区域给予零响应,此外,在每张图像中都对辨识度进行相对测量,向量(λ1,λ2)量级d定义为:对数用于改变比例,接着,对整张图像计算d的中值md=d/2。6.基于权利要求书3所述的辨识度统计,其特征在于,利用激活函数进行回归计算,识别不同程度的响应,其激活函数为:接着,定义变量a,来测量λ1和λ2之间的差异,同样地用ma表示a的中值,有:
【专利技术属性】
技术研发人员:夏春秋,
申请(专利权)人:深圳市唯特视科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。