一种运动物体检测方法技术

技术编号：40873778 阅读：4 留言：0更新日期：2024-04-08 16:42

本发明专利技术涉及一种运动物体检测方法，包括如下步骤：步骤1：数据处理模块接收输入图像，利用光流提取网络提取光流帧；利用标签提取网络获取物体边界框，形成标签；步骤2：基于插槽注意力网络构建初始模型，以光流帧和初始化的插槽作为输入，基于输出计算联合损失函数，利用标签对初始模型进行弱监督训练，利用联合损失函数进行监督，得到改进的注意力模型；步骤3：基于改进的注意力模型将光流分解为前景层和背景层，描述为插槽向量，经过解码得到运动物体的重建，进而检测运动物体。本发明专利技术能够有效的检测并分割出多个移动物体，利用标签对插槽注意力网络进行弱监督训练，可以有效的提供运动物体的真实空间信息，加速插槽注意力网络的学习过程。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机视觉，尤其涉及一种运动物体检测方法。

技术介绍

1、运动物体检测处于计算机视觉研究问题的中高层理解阶段，其研究成果对于通过计算机视觉手段进行高层感知和理解具有重要的推动作用。经过多年的研究发展，运动物体检测从低精度、低效率、灵活性差的离线检测模式，逐渐演变为高精度、高效率、灵活性强的实时在线检测模式。这其中，除了对检测框架模型的持续创新以外，运动物体的检测的研究也离不开模式识别、图像处理、人工智能等相关交叉领域最新技术的推动。因此，运动物体检测对上述相关研究领域技术的发展也起到了互相促进作用。

2、目前，运动物体检测成果已被广泛应用于社会生活、经济、军事等诸多领域中。例如：在视觉导航中，物体检测与跟踪是无人飞行器、视觉机器人、自主驾驶汽车等多种智能应用终端的核心关键技术服务；在机场、银行等重要大型场所的安保监控系统中，采用具有多运动检测与跟踪技术的智能视频监控系统，能够有效的自动检测和跟踪多个特定运动目标，大大减轻监控人员的人为劳动量，有效提高实时监控和后期追踪定位特定运动目标物体的效率与准确度。由上述内容可以看出，运动物体检测具有极其重要的研究价值。

3、但是，目前的运动物体检测算法的计算量较大，并且在某些场景下存在漏检与误检的情况。因此，如何提供一种更加准确高效的运动物体检测方法是本领域技术人员亟待解决的一个技术问题。

技术实现思路

1、本专利技术提供一种运动物体检测方法，以解决上述技术问题。

2、为解决上述技术问题，本专

3、步骤1：数据处理模块接收输入图像，利用光流提取网络分割光流场，并提取光流帧；利用标签提取网络获取图像中所有物体的边界框，形成标签；

4、步骤2：基于插槽注意力网络构建初始模型，以所述光流帧和初始化的插槽作为所述初始模型的输入，基于所述初始模型的输出计算联合损失函数，利用所述标签对所述初始模型进行弱监督训练，利用联合损失函数监督训练所述初始模型的学习，得到改进的注意力模型；

5、步骤3：基于所述改进的注意力模型将光流分解为前景层和背景层，基于分层公式，将每一层描述为一个插槽向量，对插槽向量解码得到运动物体的重建，进而检测运动物体。

6、较佳地，所述插槽注意力网络包括编码器、注意力网络模块和解码器，所述光流提取网络提取光流帧后，经由所述编码器得到特征地图，所述检测模型以所述特征地图和初始化的插槽作为输入；所述插槽经过所述解码器的解码后得到物体的重建图像。

7、较佳地，所述注意力网络模块包括注意力卷积内核模块和弱监督插槽注意力网络模块。

8、较佳地，所述插槽采用可学习的查询向量来进行初始化。

9、较佳地，所述光流提取网络采用raft网络模型。

10、较佳地，所述标签提取网络采用chatgenimage网络模型。

11、较佳地，利用所述标签对所述初始模型进行弱监督训练，利用联合损失函数监督训练所述初始模型的学习的方法包括：

12、步骤21：利用插槽解码感知机对初始模型生成的插槽进行解码，并对插槽进行层归一化，得到插槽所表示物体中心点的2d坐标向量，记为插槽向量；

13、步骤22：计算所述插槽向量与输入的所述标签的向量距离；

14、步骤23：利用插槽编码感知机对所述插槽向量进行编码，将插槽向量映射到原始插槽中。

15、较佳地，所述联合损失函数包括位置损失和多重损失，所述重建损失包括重建损失、熵正则化损失和运动一致性损失。

16、较佳地，所述重建损失与插槽注意力网络共享。

17、较佳地，采用均方误差计算所述位置损失和重建损失。

18、与现有技术相比，本专利技术提供的运动物体检测方法具有如下优点：

19、1、本专利技术提出一种基于改进插槽注意力网络的运动物体检测方法，能够利用物体的运动线索和空间线索来检测运动物体，该方法可以成功的检测和分割运动物体和静态背景；

20、2、本专利技术采用弱监督训练插槽注意力网络，使用每个物体真实的中心点坐标监督插槽注意力网络的插槽的更新生成，从而加快了插槽注意力网络的以物体为中心的学习，该方法在fbms-59等数据集上进行了验证，实验结果表明本方法在具有挑战性的场景中的鲁棒性；

21、3、本专利技术通过在插槽注意力网络中，引入注意力卷积内核对注意力网络模块进行滤波，从而降低背景噪声的干扰。

本文档来自技高网...

【技术保护点】

1.一种运动物体检测方法，其特征在于，包括如下步骤：

2.如权利要求1所述的运动物体检测方法，其特征在于，所述插槽注意力网络包括编码器、注意力网络模块和解码器，所述光流提取网络提取光流帧后，经由所述编码器得到特征地图，所述检测模型以所述特征地图和初始化的插槽作为输入；所述插槽经过所述解码器的解码后得到物体的重建图像。

3.如权利要求2所述的运动物体检测方法，其特征在于，所述注意力网络模块包括注意力卷积内核模块和弱监督插槽注意力网络模块。

4.如权利要求2所述的运动物体检测方法，其特征在于，所述插槽采用可学习的查询向量来进行初始化。

5.如权利要求1所述的运动物体检测方法，其特征在于，所述光流提取网络采用RAFT网络模型。

6.如权利要求1所述的运动物体检测方法，其特征在于，所述标签提取网络采用ChatGenImage网络模型。

7.如权利要求1所述的运动物体检测方法，其特征在于，利用所述标签对所述初始模型进行弱监督训练的方法包括：

8.如权利要求1所述的运动物体检测方法，其特征在于，所述联合损失函

9.如权利要求8所述的运动物体检测方法，其特征在于，所述重建损失与插槽注意力网络共享。

10.如权利要求8所属的运动物体检测方法，其特征在于，采用均方误差计算所述位置损失和重建损失。

...

【技术特征摘要】

1.一种运动物体检测方法，其特征在于，包括如下步骤：

3.如权利要求2所述的运动物体检测方法，其特征在于，所述注意力网络模块包括注意力卷积内核模块和弱监督插槽注意力网络模块。

4.如权利要求2所述的运动物体检测方法，其特征在于，所述插槽采用可学习的查询向量来进行初始化。

5.如权利要求1所述的运动物体检测方法，其特征在于，所述...

【专利技术属性】
技术研发人员：沈晔湖，苗洋，蒋全胜，王其聪，赵冲，朱其新，付贵忠，杨勇，牛雪梅，苗静，
申请(专利权)人：苏州科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人