当前位置: 首页 > 专利查询>安徽大学专利>正文

一种基于多模态信息融合的主动跟踪方法技术

技术编号:41115286 阅读:26 留言:0更新日期:2024-04-25 14:06
本发明专利技术涉及一种基于多模态信息融合的主动跟踪方法,包括;获取彩色图像,深度图像和法线贴图三种数据信息;将其输入多模态信息预处理模块中得到三种数据信息的初始特征;多模态信息融合模块采用预训练和正式训练的两阶段的训练方式对初始特征进行特征融合,将正式训练特征输出输入具有信息融合正则化约束的强化学习AC框架网络RACNet中,输出对应预测的执行动作;本发明专利技术利用智能体所获取的多模态信息进行融合来更精确地描述当前状态,同时增加对融合后特征的约束来提升强化学习算法训练效率,在训练效率和跟踪精度上取得了理想的效果。

【技术实现步骤摘要】

本专利技术涉及目标跟踪,尤其涉及一种基于多模态信息融合的主动跟踪方法


技术介绍

1、在计算机视觉研究领域中,目标追踪是一项极具挑战性的任务。一般意义上的目标跟踪是指在初始帧给定需要跟踪的目标,并在后续帧中持续输出该目标的位置。这种跟踪情况下一般都是假设相机固定,然后对相机视野内的运动目标进行跟踪。在这种假设下,目标很容易运动至相机视野外,或受到视野内其他物体遮挡,导致跟踪器很难再对目标进行准确跟踪和定位。而基于视觉的主动目标跟踪旨在根据视觉观测信息中的目标位置来实时调整相机位置和焦距,控制相机跟随着目标而移动,以确保目标一直处于相机视野内,具有重要的理论研究意义和实际应用价值。

2、以往的主动跟踪工作主要是将智能体感知到的视觉彩色图像输入卷积网络中得到当前时刻的状态表达,并送入到后续的强化学习网络中去。然而,这种由卷积网络提取状态表达的方法是比较耗时且效率低下的。一方面智能体可感知到的视觉信息除了彩色图像之外,还有深度图像,法线贴图等等多种模态的信息,这些多模态信息的有效融合可以为主动跟踪算法提供信息性更强的状态表达,能够更加精确地描述当前状本文档来自技高网...

【技术保护点】

1.一种基于多模态信息融合的主动跟踪方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于多模态信息融合的主动跟踪方法,其特征在于,在步骤S1中,具体过程包括以下步骤:

3.根据权利要求1所述的一种基于多模态信息融合的主动跟踪方法,其特征在于,在步骤S3中,所述多模态信息预处理模块由个CONV-MP-ReLU层叠加得到,使得该预处理模块能够对输入的各种模态数据信息进行初始的特征提取,将输入的彩色图像,深度图像和法线贴图三种数据信息尺寸调整为统一的大小,各模态下不同数据信息经过预处理后的初始特征分别为:,,;

4.根据权利要求1所述的一种基于...

【技术特征摘要】

1.一种基于多模态信息融合的主动跟踪方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于多模态信息融合的主动跟踪方法,其特征在于,在步骤s1中,具体过程包括以下步骤:

3.根据权利要求1所述的一种基于多模态信息融合的主动跟踪方法,其特征在于,在步骤s3中,所述多模态信息预处理模块由个conv-mp-relu层叠加得到,使得该预处理模块能够对输入的各种模态数据信息进行初始的特征提取,将输入的彩色图像,深度图像和法线贴图三种数据信息尺寸调整为统一的大小,各模态下不同数据信息经过预处理后的初始特征分别为:,,;

4.根据权利要求1所述的一种基于多模态信息融合的主动跟踪方法,其特征在于,在步骤s4中,所述多模态信息融合模块包括预训练过程中的多模态信息融合模块和正式训练过程中的多模态信息融合模块,所述预训练过程中的多模态信息融合模块由直接加权融合网络构成,即预训练特征输出为:;

5.根据权利要求4所述的一种基于多模态信息融...

【专利技术属性】
技术研发人员:周云吴巧云谭春雨伍煜强
申请(专利权)人:安徽大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1