一种单目标视觉跟踪神经网络结构的构建方法、装置和设备制造方法及图纸

技术编号:38161293 阅读:14 留言:0更新日期:2023-07-13 09:34
一种单目标视觉跟踪神经网络结构的构建方法、装置及设备,搜索方法包括如下操作:S1:基于若干神经网络,分别构建主干超网和头部超网;S2:对所述主干超网和头部超网分别进行训练后,进行连接,得到跟踪超网;S3:对所述跟踪超网进行训练,得到训练跟踪超网;S4:对所述训练跟踪超网进行搜索,选取主干超网的计算量与头部超网的计算量的计算量总和不超过阈值的子网络结构,获得目标神经网络结构。该方法搜索效率高,不仅获得了轻量且高效的神经网络结构,而且极大的节省了开发模型的人力,可大力推广使用。推广使用。推广使用。

【技术实现步骤摘要】
一种单目标视觉跟踪神经网络结构的构建方法、装置和设备


[0001]本专利技术涉及神经网络
,具体为一种单目标视觉跟踪神经网络结构的构建方法、装置及设备。

技术介绍

[0002]单目标视觉跟踪是计算机视觉中的一个重要研究方向,因其在智能监控、人机交互、无人驾驶等领域的广泛应用而受到关注。随着深度神经网络的兴起,面向单目标视觉跟踪的方法取得了快速的发展。目前的单目标视觉跟踪方法主要为以基于相关滤波的单目标视觉跟踪方法和基于孪生网络的单目标视觉跟踪方法。
[0003]目前主流的单目标视觉跟踪方法虽然已经取得了不错的成果,但是因为目标视觉跟踪任务的多变性,想要获得一个轻量且高效的神经网络结构,仍存在着许多挑战。

技术实现思路

[0004]本专利技术的目的是提供了一种单目标视觉跟踪神经网络结构的构建方法、装置及设备。
[0005]本专利技术技术方案如下:
[0006]本专利技术提供一种单目标视觉跟踪神经网络结构的构建方法,包括如下操作:
[0007]S1:基于若干神经网络,分别构建主干超网和头部超网;
[0008]S2:对所述主干超网和头部超网分别进行训练后,进行连接,得到跟踪超网;
[0009]S3:对所述跟踪超网进行训练,得到训练跟踪超网;
[0010]S4:对所述训练跟踪超网进行搜索,选取主干超网的计算量与头部超网的计算量的计算量总和不超过阈值的子网络结构,获得目标神经网络结构。
[0011]如上所述的方法,所述S2的操作具体为:/>[0012]训练所述主干超网,得到训练主干超网权重和训练主干网络;
[0013]训练所述头部超网,得到训练头部超网权重和训练头部网络;
[0014]所述训练主干超网权重和训练头部超网权重经互相关运算后,获得优化训练主干超网权重和优化训练头部超网权重,并分别替换所述训练主干超网权重和训练头部超网权重,所述训练主干网络与训练头部网络实现互相关连接,获得所述跟踪超网。
[0015]如上所述的构建方法,对所述主干超网进行训练的操作具体为:使用分类损失函数预训练所述主干超网,采用随机路径、均匀采样的方式搜索所述主干超网,搜索范围覆盖搜索主干超网中的所有路径,通过迭代,得到预训练权重和预训练主干超网;
[0016]使用单路径训练法训练所述预训练主干超网,采用随机路径、均匀采样的方式搜索所述预训练主干超网,训练的计算公式为:
[0017][0018]W
b
为训练主干超网权重,α
b
为主干网络结构,w(α
b
)为当前网络结构为α
b
时的主干超网权重,初始时,w(α
b
)与预训练权重相等;
[0019]在训练过程中,基于主干网络结构发生变化,得到最终训练完成的训练主干超网和训练主干超网权重。
[0020]如上所述的构建方法,对所述头部超网进行训练的操作为使用基于梯度的训练法训练所述头部超网,具体操作如下:
[0021]基于单元的搜索方法,将搜索到的所述头部超网中的子网络进行堆叠后进行同时训练,得到训练头部超网权重和训练头部超网,公式如下:
[0022][0023]W
h
为训练头部超网权重,α
h
为头部网络结构,w(α
h
)为当前网络结构为α
h
时的头部超网权重,基于头部网络结构发生变化,得到最终训练完成的所述训练头部超网和训练头部超网权重。
[0024]所述的构建方法,所述S3的操作具体为:
[0025]使用单路径训练法,基于若干个数据集依次训练所述跟踪网络若干次,前一次训练得到的跟踪网络权重作为下一次训练时的训练权重,每次训练中均采用随机路径、均匀采样的方式搜索所述跟踪网络,得到所述训练跟踪超网。
[0026]其中,所述若干次的训练中,每次训练设置训练周期为第一数值轮次,且每个训练周期中前第二数值轮次仅训练所述跟踪网络当中的头部超网。
[0027]如上所述的构建方法,所述S4中阈值为600百万浮点运算。
[0028]本专利技术提供一种单目标视觉跟踪神经网络结构的构建装置,包括:
[0029]主干超网和头部超网生成模块,用于实现基于若干神经网络,分别构建主干超网和头部超网;
[0030]跟踪超网生成模块,用于对所述主干超网和头部超网分别进行训练后,进行连接,得到跟踪超网;
[0031]训练跟踪超网生成模块,用于对所述跟踪超网进行训练,得到训练跟踪超网;
[0032]目标神经网络结构生成模块,用于对所述训练跟踪超网进行搜索,选取主干超网的计算量与头部超网的计算量的计算量总和不超过阈值的子网络结构,获得目标神经网络结构。
[0033]本专利技术提供一种单目标视觉跟踪神经网络结构的构建设备,包括处理器和存储器,其中,所述处理器执行所述存储器中保存的计算机程序时实现上述的一种单目标视觉跟踪神经网络结构的构建方法。
[0034]本专利技术提供一种计算机可读存储介质,用于存储计算机程序,其中,所述计算机程序被处理器执行时实现上述的一种单目标视觉跟踪神经网络结构的构建方法。
[0035]本专利技术的有益效果在于:
[0036]本专利技术提供了一种单目标视觉跟踪神经网络结构的构建方法,通过神经网络分别构建主干超网和头部超网,再将训练后的主干网络和头部网络进行连接,得到计算速度快,采样效率高的跟踪超网,接着训练跟踪超网,得到训练跟踪超网,然后对训练跟踪超网进行搜索,选取主干超网的计算量与头部超网的计算量的计算量总和不超过阈值的子网络结构,最终可获得轻量化和高效率的目标神经网络结构,该方法计算量小,搜索效率高,不仅获得了轻量且高效的神经网络结构,而且极大的节省了开发模型的人力,可大力推广使用;
[0037]本专利技术提供了一种单目标视觉跟踪神经网络结构的构建方法,主干网络中含有卷
积处理、池化处理,头部网络中含有卷积处理、池化处理和跳跃连接处理,可分别提高主干超网与头部超网的鲁棒性和轻量化,有利于提升最终获得的神经网络结构的处理效率和轻量化。
[0038]本专利技术提供了一种单目标视觉跟踪神经网络结构的构建方法,使用进化算法处理训练跟踪超网,去采样子网络结构,可使获得的神经网络结构更加的轻量化。
附图说明
[0039]通过阅读下文优选实施方式的详细描述,本申请的方案和优点对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。
[0040]在附图中:
[0041]图1为实施例中构建方法的流程示意图;
[0042]图2为实施例中主干超网中主干网络搜索路径示意图;
[0043]图3为实施例中训练主干超网与训练头部超网连接示意图;
[0044]图4为实施例中构建装置的结构示意图;
[0045]图5为实施例中构建设备的结构示意图。
具体实施方式
...

【技术保护点】

【技术特征摘要】
1.一种单目标视觉跟踪神经网络结构的构建方法,其特征在于,包括如下操作:S1:基于若干神经网络,分别构建主干超网和头部超网;S2:对所述主干超网和头部超网分别进行训练后,进行连接,得到跟踪超网;S3:对所述跟踪超网进行训练,得到训练跟踪超网;S4:对所述训练跟踪超网进行搜索,选取主干超网的计算量与头部超网的计算量的计算量总和不超过阈值的子网络结构,获得目标神经网络结构;所述主干超网用于对输入图像进行特征提取,所述头部超网用于对输入图像进行定位和分类。2.根据权利要求1所述的构建方法,其特征在于,所述S2的操作具体为:训练所述主干超网,得到训练主干超网权重和训练主干网络;训练所述头部超网,得到训练头部超网权重和训练头部网络;所述训练主干超网权重和训练头部超网权重经互相关运算后,获得优化训练主干超网权重和优化训练头部超网权重,并分别替换所述训练主干超网权重和训练头部超网权重,所述训练主干网络与训练头部网络实现互相关连接,获得所述跟踪超网。3.根据权利要求1或2所述的构建方法,其特征在于,对所述主干超网进行训练的操作具体为:使用分类损失函数预训练所述主干超网,采用随机路径、均匀采样的方式搜索所述主干超网,搜索范围覆盖搜索主干超网中的所有路径,通过迭代,得到预训练权重和预训练主干超网;使用单路径训练法训练所述预训练主干超网,采用随机路径、均匀采样的方式搜索所述预训练主干超网,训练的计算公式为:W
b
为训练主干超网权重,α
b
为主干网络结构,w(α
b
)为当前网络结构为α
b
时的主干超网权重,初始时,w(α
b
)与预训练权重相等;在训练过程中,基于主干网络结构发生变化,得到最终训练完成的训练主干超网和训练主干超网权重。4.根据权利要求1或2任意所述的构建方法,其特征在于,对所述头部超网进行训练的操作为使用基于梯度的训练法训练所述头部超网,具体操作如下:基于单元的搜索方法,将搜索到的所述头部超网中的子网络进行堆叠后进行同时训...

【专利技术属性】
技术研发人员:高鹏桑洪川
申请(专利权)人:曲阜师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1