一种基于语义分割的多目标跟踪方法及系统技术方案

技术编号:22238923 阅读:70 留言:0更新日期:2019-10-09 18:44
本发明专利技术提供一种基于语义分割的多目标跟踪方法,所述方法包括:读取视频或图像序列,对每一帧图像使用边界框界定目标所在位置;通过语义分割的方式对所述边界框进行像素级分割,将边界框划分为背景、以及目标的不同部位,并进行分类,得到每一类别子目标的位置信息;对获取的每一类子目标的位置信息,剔除背景类别后,将相邻两帧图像输入至特征匹配网络;计算不同帧之间子目标特征的匹配度,对子目标进行不同帧之间的数据关联,确定子目标在当前帧的位置,输出目标运动轨迹。本发明专利技术利用语义分割将跟踪目标与背景实现像素级的区分,提取出剔除背景信息的目标特征输入网络,有效的减少多目标交互带来的影响,提高多目标跟踪的精度和性能。

A Multi-target Tracking Method and System Based on Semantic Segmentation

【技术实现步骤摘要】
一种基于语义分割的多目标跟踪方法及系统
本专利技术涉及计算机视觉
,特别涉及一种基于语义分割的多目标跟踪方法及系统。
技术介绍
近年来,基于深度学习的方法在计算机视觉任务上取得突破性进展,计算机视觉技术快速发展,在智能监控、人机交互、虚拟现实和增强现实、医疗影像分析等诸多行业和领域中得到了广泛应用。目标跟踪(ObjectTracking)是经典的计算机视觉任务。通过目标跟踪得到的感兴趣区域是进一步进行高层视觉分析的基础,也是智能监控、人机交互、机器人导航和自动驾驶、虚拟现实和增强现实、医疗影像分析等的基础,目标跟踪的准确度将直接影响到计算机视觉系统的性能。多目标跟踪任务中的运动轨迹关联问题非常复杂。由于背景与目标之间的交互,多目标跟踪任务中常常伴随着错误的检测,存在目标太小、帧率低、角度、尺度变换等困难。同时,由于目标表观相似,目标间交互常常伴随着频繁的遮挡和背景信息的干扰,严重影响了跟踪的精度和性能。因此,针对现有技术中出现的背景信息干扰问题,需要一种基于语义分割的多目标跟踪方法及系统。
技术实现思路
本专利技术的一个方面在于提供一种基于语义分割的多目标跟踪方法,所述方法包括:读本文档来自技高网...

【技术保护点】
1.一种基于语义分割的多目标跟踪方法,其特征在于,所述方法包括:读取视频或图像序列,对每一帧图像使用边界框界定目标所在位置;通过语义分割的方式对所述边界框进行像素级分割,将边界框划分为背景、以及目标的不同部位,并进行分类,得到每一类别子目标的位置信息;对获取的每一类子目标的位置信息,剔除背景类别后,将相邻两帧图像输入至特征匹配网络;计算不同帧之间子目标特征的匹配度,对子目标进行不同帧之间的数据关联,确定子目标在当前帧的位置,输出目标运动轨迹。

【技术特征摘要】
1.一种基于语义分割的多目标跟踪方法,其特征在于,所述方法包括:读取视频或图像序列,对每一帧图像使用边界框界定目标所在位置;通过语义分割的方式对所述边界框进行像素级分割,将边界框划分为背景、以及目标的不同部位,并进行分类,得到每一类别子目标的位置信息;对获取的每一类子目标的位置信息,剔除背景类别后,将相邻两帧图像输入至特征匹配网络;计算不同帧之间子目标特征的匹配度,对子目标进行不同帧之间的数据关联,确定子目标在当前帧的位置,输出目标运动轨迹。2.根据权利要求1所述的方法,其特征在于,通过对视屏或图像序列中的每一帧图像进行检测,输出检测结果作为边界框界定目标所在位置。3.根据权利要求2所述的方法,其特征在于,对视屏或图像序列中的每一帧图像按照如下方法进行检测:视屏或图像序列以张量形式,经卷积神经网路模型处理,得到卷积特征图;基于感兴趣区域池化的方式,在所述卷积特征图上生成第一候选区域,并对所述第一候选区域进行边界框回归处理,得到第二候选区域;基于感兴趣区域池化的方式,提取第二候选区域的特征图,并生成第三候选区域;全连接层对所述第三候选区域进行类别判定,再次进行边界框回归处理,得到边界框界定的目标所在位置。4.根据权利要求1所述的方法,其特征在于,通过InceptionV3模型,对所述边界框进行像素级分割。5.根据权利要求1所述的方法,其特征在于,通过二分图匹配,计算不同帧之间子目标特征的匹配度,对子目标进行不同帧之间的数据关联,确定子目标在当前帧的位置。6.一种基于语义分割的多目...

【专利技术属性】
技术研发人员:林孝康张明哲傅嵩
申请(专利权)人:重庆高开清芯科技产业发展有限公司
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1