一种基于边缘场景的目标跟踪方法技术

技术编号：34367919 阅读：58 留言：0更新日期：2022-07-31 09:42

本发明专利技术公开一种基于边缘场景的目标跟踪方法，属于计算机视觉中的目标跟踪领域。为跟踪移动目标，根据利用跟踪序列预训练，在线跟踪微调的思想，选择MDNet为基础神经网络模型；图像视频数据采集和预处理；MDNet

A target tracking method based on edge scene

全部详细技术资料下载

【技术实现步骤摘要】
一种基于边缘场景的目标跟踪方法

[0001]本专利技术涉及计算机视觉中的目标跟踪
，特别涉及一种基于边缘场景的目标跟踪方法。

技术介绍

[0002]CNN(Convolutional Neural Networks，卷积神经网络)最近被应用于各种计算机视觉任务，CNN如此巨大的成功主要归功于其在表示视觉数据方面的出色表现。对于跟踪问题来说，所有的跟踪目标，虽然类别各不相同，但其实他们应该都存在某种共性，这就需要网络去学习。然而，用跟踪数据来训练很难，因为同一个目标，在某个序列中是目标，在另外一个序列中可能就是背景，而且每个序列的目标存在相当大的差异，而且会经历各种挑战，比如遮挡、形变等等。
[0003]现有的很多训练好的网络主要针对的任务比如目标检测、分类、分割等的网络很大，因为他们要分出很多类别的目标。而在跟踪问题中，一个网络只需要分两类：目标和背景。而且目标一般都相对比较小，那么其实不需要这么大的网络，会增加计算负担。因此，对设计适合于边缘场景下使用的高效神经网络架构的具有重要意义。

技术实现思路

[0004]本专利技术的目的在于提供一种基于边缘场景的目标跟踪方法，以实现为任务量身而打造嵌入式的目标跟踪。
[0005]为解决上述技术问题，本专利技术提供了一种基于边缘场景的目标跟踪方法，包括：
[0006]步骤一，为跟踪移动目标，根据利用跟踪序列预训练，在线跟踪微调的思想，选择MDNet为基础神经网络模型；
[0007]步骤二，图像视频数据采集和预处理；
>[0008]步骤三，MDNet
‑
Tiny根据MDNet构建新的共享层，以实现图像视频特征提取；
[0009]步骤四，MDNet
‑
Tiny继承MDNet多分支的具有个人特点的全连接层fc6，每个分支负责对目标进行二分类；
[0010]步骤五，对所述基于边缘场景的目标跟踪方法进行性能评估，包括准确率和重合率，并在边缘端设备上进行移植部署。
[0011]可选的，所述步骤二中，根据任务的目的，移动目标数据可以来自数据集，也可以从实际中构造自己需要的数据，从而为进行目标的跟踪做好数据储备。
[0012]可选的，所述MDNet中的共享层包含三层卷积层以及两层全连接层；所述MDNet
‑
Tiny中共享层由投影
‑
扩展
‑
投影宏架构的模块组成的卷积层和两层全连接层组成。
[0013]可选的，所述投影
‑
扩展
‑
投影宏架构由以下部分组成：
[0014]一个1
×
1卷积投影层，将输出通道投射到一个维度较低的输出张量；
[0015]具有1
×
1卷积扩展层，将通道数扩展到更高的维度；
[0016]一个深度卷积层，执行空间卷积，并具有以下功能在来自扩展层的各个输出通道
上安装不同的滤波器；
[0017]1×
1卷积投影层，将输出通道投射到输出张量较低的位置上。
[0018]可选的，所述MDNet
‑
Tiny中共享层的两层全连接层引入轻量级全连接注意力函数，在探索过程中，轻量级全连接注意力宏观架构由两个完全连接的层组成，这两个层分别是学习信道之间动态的、非线性的相互依存关系，并产生调制权重，通过信道乘法对信道进行重新加权；
[0019]所采用的轻量级全连接注意力函数FocalLoss定义如下：
[0020]FL(p)＝a(1
‑
p)rlog(p)
[0021]其中，p是不同类别的分类概率，r是大于0的值，a的取值范围为[0,1]间的小数，且a和r都是固定值。
[0022]可选的，所述MDNet中的共享层所包含的三层卷积层conv1，conv2，conv3中卷积核大小分别为7x7，5x5，3x3。
[0023]可选的，所述全连接层fc6是一个二分类层，一共有K个分支，K是训练时用的视频序列的个数，每次训练时只有对应该视频的fc6被使用，前面的层都为共享；并且在fc6
‑
K层引入轻量级全连接注意力函数。
[0024]可选的，所述准确率通过检测窗口与标记目标窗口的重叠度进行度量，设标记目标窗口为A，检测窗口为B，则重叠度IOU计算公式如下：
[0025][0026]其中，分子表示A与B窗口的重叠部分面积，分母表示A与B窗口的面积总和，IOU的值在[0,1]之间，同时IOU越接近1表示两个窗口重叠部分越多，定位准确度也就越好，反之则越差。
[0027]在本专利技术提供的基于边缘场景的目标跟踪方法中，由两部分组成，一部分是由投影
‑
扩展
‑
投影宏架构的模块组成组成的共享层，另一部分是引入轻量级全连接注意力函数的全连接层，每个分支负责对目标进行二分类。在训练时，使用用不同的视频序列来训练网络从而得到通用的共享层；在追踪一个新目标时，将预训练的共享层与全连接层相结合，构建一个新的网络图层，以适用于边缘场景下的目标跟踪。
附图说明
[0028]图1是MDNet
‑
Tiny整体架构示意图；
[0029]图2是投影
‑
扩展
‑
投影宏架构示意图；
[0030]图3是全连接注意力示意图；
[0031]图4是IOU示意图；
[0032]图5是OTB数据集下3个不同视频下的目标追踪实验结果。
具体实施方式
[0033]以下结合附图和具体实施例对本专利技术提出的一种基于边缘场景的目标跟踪方法作进一步详细说明。根据下面说明和权利要求书，本专利技术的优点和特征将更清楚。需说明的是，附图均采用非常简化的形式且均使用非精准的比例，仅用以方便、明晰地辅助说明本发
明实施例的目的。
[0034]本专利技术所述的一种适用于边缘场景的目标跟踪方法，其流程如图1所示，包含以下步骤：
[0035]S1：为了解决移动目标跟踪的问题，根据利用跟踪序列预训练，在线跟踪微调的思想，选择MDNet为基础神经网络模型；
[0036]S2：图像视频数据采集和预处理，根据任务的目的，移动目标数据采用OTB数据集，也可以从实际中构造自己需要的数据，从而为进行目标的跟踪做好数据储备；
[0037]S3：MDNet
‑
Tiny根据MDNet构建新的共享层，以实现图像视频特征提取。
[0038]在MDNet中的共享层包含三层卷积层：conv1，conv2，conv3，以及两层全连接层：fc4，fc5。在卷积层conv1，conv2，conv3中卷积核大小分别为7x7，5x5，3x3，MDNet
‑
Tiny中共享层由投影
‑
扩展
‑
投影宏架构的模块组成的卷积层和两层全连接层fc4，fc5组成。其中，投影
‑
...

【技术保护点】

【技术特征摘要】
1.一种基于边缘场景的目标跟踪方法，其特征在于，包括：步骤一，为跟踪移动目标，根据利用跟踪序列预训练，在线跟踪微调的思想，选择MDNet为基础神经网络模型；步骤二，图像视频数据采集和预处理；步骤三，MDNet
‑
Tiny根据MDNet构建新的共享层，以实现图像视频特征提取；步骤四，MDNet
‑
Tiny继承MDNet多分支的具有个人特点的全连接层fc6，每个分支负责对目标进行二分类；步骤五，对所述基于边缘场景的目标跟踪方法进行性能评估，包括准确率和重合率，并在边缘端设备上进行移植部署。2.如权利要求1所述的基于边缘场景的目标跟踪方法，其特征在于，所述步骤二中，根据任务的目的，移动目标数据可以来自数据集，也可以从实际中构造自己需要的数据，从而为进行目标的跟踪做好数据储备。3.如权利要求1所述的基于边缘场景的目标跟踪方法，其特征在于，所述MDNet中的共享层包含三层卷积层以及两层全连接层；所述MDNet
‑
Tiny中共享层由投影
‑
扩展
‑
投影宏架构的模块组成的卷积层和两层全连接层组成。4.如权利要求3所述的基于边缘场景的目标跟踪方法，其特征在于，所述投影
‑
扩展
‑
投影宏架构由以下部分组成：一个1
×
1卷积投影层，将输出通道投射到一个维度较低的输出张量；具有1
×
1卷积扩展层，将通道数扩展到更高的维度；一个深度卷积层，执行空间卷积，并具有以下功能在来自扩展层的各个输出通道上安装不同的滤波器；1
...

【专利技术属性】
技术研发人员：鞠虎，高营，田青，
申请(专利权)人：中国电子科技集团公司第五十八研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人