一种在频域部署的目标跟踪方法、电子设备及存储介质技术

技术编号:33836047 阅读:9 留言:0更新日期:2022-06-16 11:52
本发明专利技术提供了一种在频域部署的目标跟踪方法,包括:步骤1、对目标图像数据与待跟踪图像数据进行预处理;步骤2、将预处理后的图像数据变换到频域,并转换成张量形式;步骤3、选取所需数量的静态通道,并将频域下的张量联结;步骤4、将联结后的张量输入到训练好的卷积神经网络,输出目标图像数据与待跟踪图像数据对应的图像特征图;步骤5、对步骤4得到的图像特征图进行互相关操作,得到响应图,从响应图中即可得到目标的跟踪位置。本发明专利技术提出的方案在频域进行建立和训练了目标跟踪深度神经网络,利用DCT变换避免了传统频域计算的虚部运算,减少了计算复杂度;在计算复杂度降低的基础上,保持了跟踪准确度。保持了跟踪准确度。保持了跟踪准确度。

【技术实现步骤摘要】
一种在频域部署的目标跟踪方法、电子设备及存储介质


[0001]本专利技术涉及图像处理领域,特别涉及一种在频域部署的目标跟踪方法、电子设备及存储介质。

技术介绍

[0002]随着计算机图像处理技术的迅速发展和广泛应用,对于目标检测技术的需求也逐渐上升,例如人脸检测、行人检测、车辆检测等等。目标检测俨然已经成为计算机视觉和模式识别领域的基本问题,孪生网络系列作为其重要分支,通过将目标跟踪问题描述成学习一个通用的相似性映射函数问题,较好地平衡了精度与时间复杂度,得到了迅速繁荣。所跟踪的视频图像特征复杂且多样,不仅表现于空域,频域也是一类重要特征。目前深度学习在计算机视觉的各个方面都取得了巨大进展,但主要在时域搭建模型并进行训练,也有少量研究者尝试在频域采用深度学习方法进行物体分类和识别,但还未有在频域采用深度学习方法进行目标跟踪的算法及部署的研究。

技术实现思路

[0003]针对现有技术中存在的问题,提供了一种在频域部署的目标跟踪方法、电子设备及存储介质,解决了在频域建立深度神经网络进行目标识别的各种问题,与现有的时域深度目标跟踪方法比较,在计算量降低的同时,保持了跟踪的准确度。
[0004]本专利技术采用的技术方案如下:一种在频域部署的目标跟踪方法,包括以下步骤:
[0005]步骤1、对目标图像数据与待跟踪图像数据进行预处理;
[0006]步骤2、将预处理后的图像数据变换到频域,并转换成张量形式;
[0007]步骤3、选取所需数量的静态通道,并将频域下的张量联结;
[0008]步骤4、将联结后的张量输入到卷积神经网络,输出目标图像数据与待跟踪图像数据对应的图像特征图;
[0009]步骤5、对步骤4得到的图像特征图进行互相关操作,得到响应图,从响应图中即可得到目标的跟踪位置。
[0010]进一步的,所述步骤1中预处理包括:将图片从RGB转换到YCrCb色域,并采用拉伸的方式,随机调整图像的大小,之后再裁剪成所需图像大小,形成YCrCb色域下的图像特征。
[0011]进一步的,所述步骤2中,将YCrCb色域下的图像特征进行DCT变换,将空域特征转换为频域特征,同时产生192个静态通道。
[0012]进一步的,所述步骤2中,在DCT模式下将PIL Image或ndarray转换成张量形式,并归一化至[0

1]区间。
[0013]进一步的,所述步骤2中,在进行DCT变换之前,先将原始图像进行分块,在逐一进行变换。
[0014]进一步的,所述DCT变换的具体方式为:
[0015]正向DCT变换:
[0016][0017]反向DCT变换:
[0018][0019]进一步的,所述步骤3中静态通道选取方法:采用正方形或三角形方式对静态通道进行选择。
[0020]进一步的,所述卷积神经网络由依次连接的卷积层conv1、conv2、conv3、conv4、conv5组成,每层卷积层的卷积核均为3*3,步长为1;其输入能够接收192个通道以内的图像特征。
[0021]本专利技术还提出了一种电子设备,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行上述的在频域部署的目标跟踪方法对应的计算机程序。
[0022]本专利技术还提出了一种计算机可读存储介质,其上存储有计算机程序指令,其中,所述程序指令被处理器执行时用于实现上述的在频域部署的目标跟踪方法对应的过程。
[0023]与现有技术相比,采用上述技术方案的有益效果为:
[0024](1)在频域建立和训练的目标跟踪深度神经网络。
[0025](2)利用DCT变换避免了传统频域计算的虚部运算,减少了计算复杂度。
[0026](3)在计算复杂度降低的基础上,保持了跟踪准确度。
附图说明
[0027]图1为本专利技术提出的在频域部署的目标跟踪方法流程图。
[0028]图2为本专利技术一实施例中目标跟踪算法架构图。
[0029]图3为本专利技术一实施例中预处理及变换示意图。
[0030]图4为本专利技术一实施例中卷积神经网络结构图。
[0031]图5为本专利技术现有跟踪算法架构图。
[0032]图6为本专利技术现有卷积神经网络结构图。
[0033]图7为本专利技术一实施例中SiamFC算法在TB50下的测试结果图。
[0034]图8为本专利技术一实施例中SiamFC算法在TB100下的测试结果图。
[0035]图9为本专利技术一实施例中SiamFC算法在CVPR13下的测试结果图。
[0036]图10为本专利技术一实施例中dctsiamfc算法在TB50下的测试结果图。
[0037]图11为本专利技术一实施例中dctsiamfc算法在TB100下的测试结果图。
[0038]图12为本专利技术一实施例中dctsiamfc算法在CVPR13下的测试结果图。
具体实施方式
[0039]下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。相反,本
申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
[0040]实施例1
[0041]目前的目标跟踪达到在空域进行,而频域特征下的滤波器会优于空域特征下的降采样操作,这使得若缩小到同等特征维度下去提升算法的运算速度时,采用频域的算法可以更好保留算法的原有精度,因此,本实施例提出了在频域进行的目标跟踪方法,具体方案如下:
[0042]如图1所示,一种在频域部署的目标跟踪方法,包括以下步骤:
[0043]步骤1、对目标图像数据与待跟踪图像数据进行预处理;
[0044]步骤2、将预处理后的图像数据变换到频域,并转换成张量形式;
[0045]步骤3、选取静态通道,并将频域下的张量联结;
[0046]步骤4、将联结后的张量输入到卷积神经网络,输出目标图像数据与待跟踪图像数据对应的图像特征图;
[0047]步骤5、对步骤4得到的图像特征图进行互相关操作,得到响应图,从响应图中即可得到目标的跟踪位置。
[0048]具体的,所述步骤1中预处理包括:将图片从RGB转换到YCrCb色域,并采用拉伸的方式,随机调整图像的大小,之后再裁剪成所需图像大小,形成YCrCb色域下的图像特征。
[0049]在步骤2中,将YCrCb色域下的图像特征进行DCT变换,将空域特征转换为频域特征,同时产生192个静态通道。在DCT模式下将PIL Image或ndarray转换成张量形式,并归一化至[0

1]区间。
[0050]频域的数据预处理及变换整体过程如图3所示,遵循传统(SiamFC算法)的数据预处理过程并增加了数据流在空间域中的变换,包括图像的缩放、裁剪、翻转等本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种在频域部署的目标跟踪方法,其特征在于,包括以下步骤:步骤1、对目标图像数据与待跟踪图像数据进行预处理;步骤2、将预处理后的图像数据变换到频域,并转换成张量形式;步骤3、选取所需数量的静态通道,并将频域下的张量联结;步骤4、将联结后的张量输入到训练好的卷积神经网络,输出目标图像数据与待跟踪图像数据对应的图像特征图;步骤5、对步骤4得到的图像特征图进行互相关操作,得到响应图,从响应图中即可得到目标的跟踪位置。2.根据权利要求1所述的在频域部署的目标跟踪方法,其特征在于,所述步骤1中,预处理包括:将图片从RGB转换到YCrCb色域,并采用拉伸的方式,随机调整图像的大小,之后再裁剪成所需图像大小,形成YCrCb色域下的图像特征。3.根据权利要求2所述的在频域部署的目标跟踪方法,其特征在于,所述步骤2中,将YCrCb色域下的图像特征进行DCT变换,将空域特征转换为频域特征,同时产生192个静态通道。4.根据权利要求3所述的在频域部署的目标跟踪方法,其特征在于,所述步骤2中,在DCT模式下将PIL Image或ndarray转换成张量形式,并归一化至[0

1]区间。...

【专利技术属性】
技术研发人员:王侃王伟戴礼灿张海瀛
申请(专利权)人:中国电子科技集团公司第十研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1