动态的目标对象检测方法、装置、存储介质及设备制造方法及图纸

技术编号：27503089 阅读：61 留言：0更新日期：2021-03-02 18:28

本申请实施例公开了一种动态的目标对象检测方法、装置、存储介质及设备，属于图像处理技术领域。所述方法包括：获取待检测的视频；按照预定时间间隔依次从所述视频中提取视频帧；将所述视频帧按照时间顺序依次输入长短时记忆网络，得到输出结果；将所述输出结果按照时间顺序依次输入卷积神经网络；利用所述卷积神经网络进行检测，得到每个视频帧中的目标对象。本申请实施例可以保留视频帧之间的上下文信息，减少信息冗余，从而可以提高目标对象的检测速度。检测速度。检测速度。

全部详细技术资料下载

【技术实现步骤摘要】
动态的目标对象检测方法、装置、存储介质及设备

[0001]本申请实施例涉及图像处理
，特别涉及一种动态的目标对象检测方法、装置、存储介质及设备。

技术介绍

[0002]目标对象检测是指从图像中检测出感兴趣的物体，包括物体的定位和分类。动态的目标对象检测应用较为广泛，比如应用于汽车的自动驾驶，从而可以识别出移动的行人和车辆，以便于规划驾驶路线。当在实时采集的视频中检测动态的目标对象时，视频中前后帧之间的信息存在大量的冗余，因此，需要对前后帧之间的信息进行精简，从而提高目标对象的检测速度。
[0003]相关技术中可以采用FGFA(Flow-Guided Feature Aggregation，视频物体检测)算法来检测动态的目标对象。FGFA算法主要由光流模块提取当前帧和相邻帧的光流，并将相邻帧的特征与当前帧的特征进行组合，组合后将当前帧与相邻帧的多个特征进行融合，从而根据融合后的特征检测出目标对象。
[0004]然而，FGFA算法需要先计算多帧的光流，再对特征进行结合，使得检测过程中的计算量特别大，从而影响了目标对象的检测速度。

技术实现思路

[0005]本申请实施例提供了一种动态的目标对象检测方法、装置、存储介质及设备，用于解决相关技术中检测过程中的计算量大，导致目标对象的检测速度慢的问题。所述技术方案如下：
[0006]一方面，提供了一种动态的目标对象检测方法，所述方法包括：
[0007]获取待检测的视频；
[0008]按照预定时间间隔依次从所述视频中提取...

【技术保护点】

【技术特征摘要】
1.一种动态的目标对象检测方法，其特征在于，所述方法包括：获取待检测的视频；按照预定时间间隔依次从所述视频中提取视频帧；将所述视频帧按照时间顺序依次输入长短时记忆网络，得到输出结果；将所述输出结果按照时间顺序依次输入卷积神经网络；利用所述卷积神经网络进行检测，得到每个视频帧中的目标对象。2.根据权利要求1所述的方法，其特征在于，所述将所述视频帧按照时间顺序依次输入长短时记忆网络，得到输出结果，包括：在将第t个视频帧输入所长短时记忆网络时，获取第t-1个状态和所述第t个视频帧，所述第t-1个状态是第t-1个视频帧对应的状态信息，所述t为大于1的正整数；利用所述长短时记忆网络对所述第t-1个状态和所述第t个视频帧进行计算，第t个输出；将所述第t个输出作为所述第t个视频帧对应的输出结果。3.根据权利要求2所述的方法，其特征在于，所述利用所述长短时记忆网络对所述第t-1个状态和所述第t个视频帧进行计算，得到第t个输出，包括：利用所述长短时记忆网络对所述第t-1个状态和所述第t个视频帧进行计算，得到第t个状态；对所述第t个视频帧进行两次卷积运算，得到第一卷积结果；利用sigma函数对所述第一卷积结果进行运算，得到第一运算结果；将所述第一运算结果乘以所述第t个状态，得到所述第t个输出。4.根据权利要求3所述的方法，其特征在于，所述利用所述长短时记忆网络对所述第t-1个状态和所述第t个视频帧进行计算，得到第t个状态，包括：利用所述长短时记忆网络根据所述第t-1个状态和所述第t个视频帧计算第一临时量；利用所述长短时记忆网络根据所述第t个视频帧计算第二临时量；将所述第一临时量和所述第二临时量相加，得...

【专利技术属性】
技术研发人员：王堃，
申请(专利权)人：江苏禹空间科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人