一种基于改进SiamFC的单目标交通标志跟踪方法技术

技术编号:33846711 阅读:43 留言:0更新日期:2022-06-18 10:31
本发明专利技术公开了一种基于改进SiamFC的单目标交通标志跟踪方法。该发明专利技术在多分辨率单目标检测方向上有一定的通用性,该专利以交通标志跟踪为说明案例,交通标志的跟踪采集易存在光照不均、模糊等影响。针对单目标跟踪问题,将SiamFC算法中的骨干网络由AlexNet变为ResNet

【技术实现步骤摘要】
一种基于改进SiamFC的单目标交通标志跟踪方法


[0001]本专利技术涉及深度学习中的目标跟踪领域,通过改进后的SiamFC算法对交通标志进行目标跟踪。

技术介绍

[0002]随着互联网在全球范围内的扩展,中国互联网快速发展,互联网技术不断革新提升,人工智能领域的研究也不断深入。其中,无人驾驶技术由于便利性及应用领域广泛,成为了当下研究的热点方向。但是,现阶段的无人驾驶技术对交通标志的跟踪识别并不成熟。受环境温湿度、极端天气状况及灯光等外界环境因素影响,对交通标志的跟踪采集易存在光照不均、模糊等问题;此外,随着我国基础建设不断发展,隧道、坡路、急弯等复杂路况里程数增加,交通标志易被沙尘污秽,被外物遮挡;同时,受限于无人驾驶汽车车载设备技术限制,采集到的视频中的道路交通标志在可视范围内较小,出现时间较短;此外,道路交通标志具有丰富的种类和相似的外观,其在不同地区出现频次不同,分布极不均衡,进一步加大了道路交通标志检测的难度。因此,针对实际场景中道路交通标志的检测识别,提出一种迅速而精确的方法具有迫切工程意义。
[0003]孪生网络(siamFC)特点是有两个图片作为输入,两个网络共享权重并使用相同的网络,通过计算某种距离量度计算出相似度,可以理解为在同一个网络上将两个输入编码成两个向量,在计算向量的相似度,借此来判断原始输入的相似性。相比较于卷积神经网络的单个输入,孪生网络分为多个分支,并且每个分支都由卷积神经网络构成,每个网络均有多个输入,可以在一条分支上提供先验知识,先验信息可以使孪生网络在只有少量训练样本上较好的学习网络参数,达到与大量样本训练单个卷积神经网络同样的性能。由于SiamFC算法采取了端到端的训练方式,充分发挥了大数据的优势,能够很好适应单目标跟踪任务。此外,多分辨率在线选择分支方法的引入,优化了单目标跟踪中遇到的形变、尺度变化等相关问题,使跟踪过程更加准确,针对目标对象发生较大位移或者遮挡时,具有较好效果。因此,针对复杂背景环境下无人驾驶技术,提出一种基于改进SiamFC的单目标交通标志跟踪方法具有重要意义。

技术实现思路

[0004]为了克服上述现有技术的不足,本专利技术提出了一种基于改进的SiamFC单目标跟踪技术。该技术引用了深度学习中的通用目标跟踪框架SiamFC,并针对交通标志跟踪出现的问题进行了进一步的改进。
[0005]步骤一:将在线选择分支结构应用到算法中,使用多个卷积孪生网络训练图像序列,输出多个特征响应图,通过在线选择分支结构,选择特征响应图值最大的结果,进行后续的操作。
[0006]步骤二:输入包括从第一个视频帧裁剪的目标patch和当前帧中包含搜索区域的另一个patch。目标patch z的大小为W1×
H1×
3,对应于图像patch的宽度、高度和颜色通道。
搜索区域x的大小为W2×
H2×
3,其中W2>W1,H2>H1也表示搜索区域的宽度、高度.
[0007]步骤三:该步骤是该专利的核心内容,将SiamFC算法中骨干网络AlexNet替换为ResNet

50深层网络。基于ResNet

50的单目标跟踪算法的网络结构与SiamFC算法相似,所用的网络都是孪生网络结构,骨干网络选择了更深的ResNet

50,能够提取到更加有利的信息,提高跟踪的准确率。在确定第一帧目标图像之后,将目标图像和待搜索区域的图像同时输入ResNet

50的网络中,两个网络之间共享权重,各自输出不同的特征图,将目标图像特征图和待搜索区域的图像的特征图进行互相关运算,最终得到响应得分图,其中响应得分图中最大的位置即为目标位置。ResNet的思想在于引入了一个深度残差框架来解决梯度消失的问题,即让卷积神经网络去学习残差映射,而不是期望每一个堆叠层的网络都完整的拟合潜在的映射(拟合函数)。通过引入一个shortcut(捷径)分支,将需要拟合的映射变为残差F(x)=H(x)

x。ResNet也就是残差网络很好的解决了越深的网络返回的梯度相关性会越来越差和接近于白噪声,导致梯度更新也接近于随即扰动的问题。
[0008]步骤四:在SiamFC算法中,要求网络需要满足严格的平移不变性,即padding为。还需要网络具有对称性。如果破坏了网络的平移不变性,那么算法将会出现学习到位置偏见,因为SiamFC算法的训练方法,正样本均在正中心。由于卷积操作中的padding操作会将图像进行补零操作,所以会对ResNet网络的训练造成影响。本文中为了消除该影响,采用了均匀分布的采样策略,该采样策略可以让目标在中心点发生偏移,该偏移量可以缓解网络破坏严格平移不变性所带来的影响。该方法成功消除了位置偏见,使得采用了padding的深层网络可以使用在跟踪算法中。
附图说明
[0009]图1为:基于ResNet

50的单目标跟踪算法流程图。
[0010]具体方法
[0011](1)使用上下文相关的S1分支和一个通用分支。所有这些分支都具有与SiamFC网络相同的结构。上下文相关的分支通过三个步骤进行训练。首先,在ILSVRC

2015视频数据集上训练基本的孪生网络,包括4000个视频序列和大约130万帧,包含大约200万个跟踪对象。保留基本的孪生网络作为总分支。然后,在ImageNet视频数据集的低层特征图上执行上下文聚类,以发现S2(S2=10)上下文相关的聚类。最后,使用S2集群来训练由基本Siamese网络初始化的S2上下文相关的分支。这些分支以(z,X)作为输入并提取它们的特征映射。然后,使用一个互相关层。
[0012](2)使用AlexNet对映像分类任务进行预训练,将其作为一个分支,并对网络进行不同任务的训练。对stride进行了小的修改,以确保输出响应映射具有与其他分支相同的维度。AlexNet网络结构总共分为8层,其中第1

5层为卷积层,第6

8层为全连接层。在第一层、第二层和第五层卷积层的后面各有一个最大池化层。网络结构的最后一层为softmax,其输入是前面全连接层的输出,softmax会产生1000种类型标签的分布网络,包含了8个带权重的层。AlexNet网络的优势在于网络结构方面比传统的网络更加有深度。其结构包含5个卷积层、3个全连接层和1个softmax层其次引入Dropout,解决了过拟合的问题。此外将激活函数替换为ReLU函数,前文曾提到sigmoid函数和tanh具有饱和区,而ReLU函数在变量值大于0时,其导数一直都是1。
[0013](3)给定输入图像对,每个分支对两个输入应用相同的转换,并使用互相关层计算响应映射h。由于不同分支的特征值的范围不同,对每个分支的响应映射应用Wi权值来标准化它们的范围差异。然后根据各支路的加权响应图测量识别能力。
[0014](4)将SiamFC算法中的骨干网络由AlexNet本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进SiamFC的单目标交通标志跟踪方法,其特征在于将SiamFC算法中骨干网络AlexNet替换为ResNet

50深层网络,包括以下步骤:步骤一:将在线选择分支结构应用到算法中,使用多个卷积孪生网络训练图像序列,输出多个特征响应图,通过在线选择分支结构,选择特征响应图值最大的结果,进行后续的操作;步骤二:输入包括从第一个视频帧裁剪的目标patch 1和当前帧中包含搜索区域的另一个patch 2。目标patch 1的大小为W_1
×
H_1
×
3,对应于图像的宽度、高度和颜色通道。patch 2的大小为W_2
×
H_2
×
3,其中W_2&...

【专利技术属性】
技术研发人员:贾海涛江雪婷黄婧陈泓秀谭志昊李彧许文波
申请(专利权)人:电子科技大学长三角研究院湖州
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1