一种运动目标位姿跟踪方法及装置制造方法及图纸

技术编号：24252841 阅读：39 留言：0更新日期：2020-05-23 00:15

本申请适用于计算机机器视觉技术领域，提供了一种运动目标位姿跟踪方法及装置，所述运动目标位姿跟踪方法包括：获取关于待跟踪目标的运动图像集；分别将所述运动图像集内各个运动图像帧导入特征提取网络，输出各个所述运动图像帧对应的特征卷积层图像；将所述特征卷积层图像导入跟踪网络，确定所述待跟踪目标在所述运动图像帧内的位姿信息；基于所述待跟踪目标在各个所述运动图像帧内的所述位姿信息以及所述运动图像集，确定所述待跟踪目标的运动跟踪数据。本申请通过自监督的深度学习来训练用于对运动目标进行位姿跟踪的神经网络，基于训练后的神经网络实时预测运动目标的位姿，实现对运动目标的位姿跟踪。

A method and device for tracking the pose of moving target

全部详细技术资料下载

【技术实现步骤摘要】
一种运动目标位姿跟踪方法及装置
本申请属于图像处理
，尤其涉及一种运动目标位姿跟踪方法及装置。
技术介绍
人工智能今年来已成为全球范围内的研究热点之一，实现人工智能即使机器如人类一般进行思考，工作，而实现的方式之一就是赋予机械各种感知能力。其中在机械视觉
中，目标位姿跟踪技术具有重要意义。现有技术中目标位姿跟踪技术可以分为运动目标捕捉和目标姿态估计，运动目标捕捉技术包括有光流法、帧间差分法、背景减除法等方法，这些方法存在容易受外界因素影响精度，不能同时兼顾运动目标位置捕捉和目标轮廓检测，泛用性差等缺陷；目标姿态估计方法中ICP姿态估计算法需要在三维点云空间中进行迭代运算，这种方法存在参数获取困难，数据处理速度慢的缺陷。深度学习已经成为机器视觉、图像处理等领域的热点，现有技术中目标位姿跟踪技术基于深度学习，构建卷积神经网络，直接通过2D图像信息预测控制点图像坐标，进而建立2D-3D控制点对应，实现位姿参数的求解，但这种方法存在精度不高的缺陷。
技术实现思路
本申请实施例提供了一种运动目标位姿跟踪方法及装置，可以基于神经网络来预测运动目标的位姿信息，从而确定运动目标的运动跟踪数据，基于该运动跟踪数据实现对运动目标的位姿跟踪，提高对运动目标的运动跟踪精度，解决现有技术中对运动目标的运动跟踪精度不高的问题。第一方面，本申请实施例提供了一种运动目标位姿跟踪方法，包括：获取关于待跟踪目标的运动图像集；分别将所述运动图像集内各个运动图像帧导入特征提取网...

【技术保护点】
1.一种运动目标位姿跟踪方法，其特征在于，包括：/n获取关于待跟踪目标的运动图像集；/n分别将所述运动图像集内各个运动图像帧导入特征提取网络，输出各个所述运动图像帧对应的特征卷积层图像；/n将所述特征卷积层图像导入跟踪网络，确定所述待跟踪目标在所述运动图像帧内的位姿信息；/n基于所述待跟踪目标在各个所述运动图像帧内的所述位姿信息以及所述运动图像集，确定所述待跟踪目标的运动跟踪数据。/n

【技术特征摘要】
1.一种运动目标位姿跟踪方法，其特征在于，包括：
获取关于待跟踪目标的运动图像集；
分别将所述运动图像集内各个运动图像帧导入特征提取网络，输出各个所述运动图像帧对应的特征卷积层图像；
将所述特征卷积层图像导入跟踪网络，确定所述待跟踪目标在所述运动图像帧内的位姿信息；
基于所述待跟踪目标在各个所述运动图像帧内的所述位姿信息以及所述运动图像集，确定所述待跟踪目标的运动跟踪数据。

2.如权利要求1所述的运动目标位姿跟踪方法，其特征在于，所述将所述特征卷积层图像导入跟踪网络，确定所述待跟踪目标在所述运动图像帧内的位姿信息，包括：
将所述特征卷积图像导入Mask-RCNN网络，生成感兴趣区域ROI卷积层图像以及图像特性信息，包括：基于所述ROI卷积层图像确定所述运动图像帧中关于所述待跟踪目标的图像掩码区域；
将所述ROI卷积层图像以及所述图像掩码区域导入到Pose预测网络，确定所述待跟踪目标在所述运动图像帧内的位姿特征参数；
基于所述图像特性信息以及所述位姿特征参数确定所述位姿信息。

3.如权利要求2所述的运动目标位姿跟踪方法，其特征在于，所述将所述ROI卷积层图像以及所述图像掩码区域导入到Pose预测网络，确定所述待跟踪目标在所述运动图像帧内的位姿特征参数，包括：
基于所述图像掩码区域对所述ROI卷积层图像进行掩模处理，得到掩码特征图；
基于所述掩码特征图，确定所述待跟踪目标在所述运动图像帧内的所述位姿特征参数。

4.如权利要求2或3所述的运动目标位姿跟踪方法，其特征在于，所述运动目标位姿跟踪方法包括：
基于训练数据集预训练所述特征提取网络；
将预设的标注数据集导入所述跟踪网络，确定跟踪网络损失；所述跟踪网络损失包括第一损失以及第二损失；
基于所述跟踪网络损失训练所述跟踪网络；
所述标注数据集包括关于各个训练目标的训练图像集、所述训练图像集各个训练图像帧对应的训练卷积特征图以及所述训练目标在所述训练图像集中的各个训练图像帧内对应的标注信息。

5.如权利要求4所述的运动目标位姿跟踪方法，其特征在于，所述标注信息包括所述训练目标在所述训练图像帧内的真值分类、真值边框、真值图像掩码区域；所述将预设的标注数据集导入所述跟踪网络，确定跟踪网络损失，包括：
将所述训练卷积特征图导入所述Mask-RCNN网络，得到训练ROI卷积层图像；
基于所述训练ROI卷积层...

【专利技术属性】
技术研发人员：徐培，刘培超，郎需林，刘主福，
申请(专利权)人：深圳市越疆科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人