【技术实现步骤摘要】
一种基于Transformer的轻量化目标识别与跟踪系统及方法
[0001]本专利技术属于目标识别及跟踪
,尤其涉及一种基于Transformer的轻量化目标识别与跟踪系统及方法。
技术介绍
[0002]目标跟踪在实际场景中应用广泛,通常作为大型视觉系统中的组成部分,在诸如无人驾驶,场景感知探测,智能交通,机器人等领域有重要的应用。随着硬件的不断升级换代,基于海量数据的深度学习方法被越来越多的研究以及应用。依赖于复杂的模型设计以及大数据训练,基于卷积神经网络的目标跟踪算法在跟踪精度上相比传统的跟踪算法有较大优势,但是由于庞大的计算量,使其在实时在边缘端设备运行还存在难度。同样,目标遮挡、目标的旋转和变形、背景杂波、相似目标的干扰、背景的变化等目标跟踪中的挑战任然存在,极容易造成目标的丢失。
[0003]现有技术FEAR(FEAR:Fast、Efficient、Accurate and Robust Visual Tracker)提出了一种快速、高效、准确、鲁棒的跟踪器,提出两个轻量化模型,dual
‑
template module和pixel
‑
wise fusion block。前者使用一个可学习的参数集成了时域信息,而后者使用更少的参数编码了更有判别性的特征。现有技术LightTrack(LightTrack:Finding Lightweight Neural Networks for Object Tracking via One
‑
Shot ...
【技术保护点】
【技术特征摘要】
1.一种基于Transformer的轻量化目标识别与跟踪系统,其特征在于,所述系统包括:目标识别与跟踪节点和智能无人体底盘控制节点;所述目标识别与跟踪节点包括:获取单元,被配置为获取视频流,从所述视频流获取待跟踪目标,并生成用于跟踪所述待跟踪目标的任务指令,将该任务指令发送给解析单元;解析单元,被配置为解析所述任务指令,其中,所述任务指令包括所述待跟踪目标的位置以及加速标识,所述加速标识用于指示跟踪算法是否需要加速处理,将所述位置以及加速标识发送给跟踪和检测单元;跟踪和检测单元,被配置为基于所述位置以及所述加速标识对所述待跟踪目标进行跟踪和检测,得到所述待跟踪目标的跟踪信息和检测结果,将所述跟踪信息和检测结果发送给封装单元;封装单元,被配置为封装所述检测结果和所述跟踪信息,得到封装后的跟踪信息,将封装后的跟踪信息以跟踪话题的形式发送给所述智能无人体底盘控制节点;所述智能无人体底盘控制节点包括:跟踪话题获取模块,从所述跟踪信息获取所述跟踪话题;跟踪信息获取模块,订阅所述跟踪话题,从所述跟踪话题获取被跟踪目标信息,并发送给坐标解算模块;坐标解算模块,对所述被跟踪目标信息进行坐标解算,将解算得到的移动方向和距离信息传递给智能无人体底盘控制模块;所述智能无人体底盘控制模块接收所述移动方向和距离信息,并根据所述移动方向和距离信息对所述智能无人体底盘进行控制。2.根据权利要求1所述的轻量化目标识别与跟踪系统,其特征在于,所述获取单元包括:算法检测子模块,采用topic订阅或rtsp协议的方式获取视频流,检基于所述视频流测目标信息,并输出给指控平台;指控平台,接收到目标信息,生成用于跟踪所述待跟踪目标的任务指令,将该任务指令发送给解析单元;其中,所述任务指令指示是否选中目标,根据检测到的目标信息确定选中目标。3.根据权利要求1所述的轻量化目标识别与跟踪系统,其特征在于,所述解析模块解析所述任务指令中待跟踪目标的位置以及加速标识,并将所述位置以及所述加速标识作为所述待跟踪目标的初始化信息。4.根据权利要求3所述的轻量化目标识别与跟踪系统,其特征在于,所述解析模块根据任务指令判断是否选中目标,若没有目标被选中则回到指控平台,若有目标被选中,则将被选中目标的所述位置以及所述加速标识作为被跟踪目标的初始化信息。5.根据权利要求4所述的轻量化目标识别与跟踪系统,其特征在于,所述跟踪和检测单元基于所述位置以及所述加速标识对所述待跟踪目标进行跟踪和检测包括:若所述加速标识指示无需加速处理,则基于第一模型对所述待跟踪目标进行跟踪和检测,得到所述待跟踪目标的跟踪信息和检测结果;或若所述加速标识指示需加速处理,则基于所述加速标识指示的加速类型,基于第二模
型或第三模型进行加速处理得到所述待跟踪目标的跟踪信息和检测结果。6.根据权利要求5所述的轻量化目标识别与跟踪系统,所述第一模型包括第一输入端、第二输入端、骨干网络模块、MCBN模块、第一CCBR模块、第二CCBR模块、第三CCBR模块及第四CCBR模块,其特征在于,基于第一模型对所述待跟踪目标进行跟踪和检测包括:通过第一输入端接收所述待跟踪目标的参考帧图像,并通过第二输入端接收所述视频流中待检测视频帧;将所述参考帧图像和所述待检测视频帧输入骨干网络模块,其中,所述骨干网络模块提取所述参考帧图像的第一特征及所述待检测视频帧的第二特征;将所述第一特征、所述第二特征输入所述MCBN模块,其中,所述MCBN模块对所述第一特征进行像素级融合处理得到第三特征、对所述第二特征进行像素级融合处理得到第四特征,并将所述第三特征经过卷积处理、批量归一化及RELU激活函数处理得到第五特征,并将所述第四特征经过卷积处理、批量归一化及RELU激活函数处理得到第六特征;将所述第五特征输入第一CCBR模块、将所述第六特征输入第三CCBR模块,其中,所述第一CCBR模块对所述第五特征进行像素级相关融合处理得到第七特征,所述第三CCBR模块对所述第六特征进行像素级相关融合处理得到第八特征;将所述第七特征输入第二CCBR模块得到所述待跟踪目标分类得分,将所述第八特征输入第四CCBR模块得到所述待跟踪目标坐标,并对所述待跟踪目标分类得分与所述待跟踪目标坐标进行匹配筛选,得到所述待跟踪目标的跟踪信息和检测...
【专利技术属性】
技术研发人员:李绍明,赵洪深,王家,
申请(专利权)人:中国电子科技南湖研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。