The present disclosure provides a target detection method, a target detection device and a computer readable storage medium based on a neural network. The target detection method includes: acquiring the continuous frame image containing the target to be detected; acquiring the first feature information of each frame image in the continuous frame image by using the first feedforward neural network; and acquiring each of the frames based on the first feature information of each frame image by using the second bidirectional feedback neural network. The second characteristic information of the frame image; based on the second characteristic information, it is determined that each frame image of the continuous frame image contains one or more regions of the target, in which the second characteristic information of each frame image synthesizes the second characteristics of the predetermined number of previous and subsequent frames of each frame image. Information.
【技术实现步骤摘要】
目标检测方法、目标检测装置和计算机可读存储介质
本公开涉及图像处理领域,更具体地,本公开涉及一种基于神经网络的目标检测方法、目标检测装置和计算机可读存储介质。
技术介绍
目标检测是计算机视觉领域中一个基础性的研究课题,其在人脸识别、安全监控以及动态追踪等很多方面都有广泛的应用前景。在目标检测中,对包括作为目标的行人、车辆的视频结构化是诸多安防应用中不可或缺的。神经网络是一种大规模、多参数优化的工具。依靠大量的训练数据,神经网络能够学习出数据中难以总结的隐藏特征,从而完成多项复杂的任务,如人脸检测,图片分类,物体检测,动作追踪,自然语言翻译等。神经网络已被人工智能界广泛应用。当前,诸如行人检测的目标检测中最广泛应用的是卷积神经网络。在现有的目标检测方法中,往往把目标(行人和车辆)检测、目标追踪以及视频结构化分成三个独立的步骤来完成。在目标检测步骤中,对每一帧图像,找到作为目标的行人或车辆,通过边框把它们的位置和大小表示出来。然后,把各帧中检测到的目标,根据空间位置、外观相似程度等因素关联在一起,从而进行目标追踪步骤。最后,分析一条追踪轨迹中各个边框中行人或车辆的属性 ...
【技术保护点】
1.一种目标检测方法,包括:获取包含目标的待检测的连续帧图像;利用第一前馈神经网络,获取所述连续帧图像中的每一帧图像的第一特征信息;利用第二双向反馈神经网络,基于所述每一帧图像的第一特征信息,获取所述每一帧图像的第二特征信息;基于所述第二特征信息,确定所述连续帧图像的每一帧图像中包含目标的一个或多个区域,其中,所述每一帧图像的所述第二特征信息综合所述每一帧图像的预定数目的之前帧和之后帧的所述第二特征信息。
【技术特征摘要】
1.一种目标检测方法,包括:获取包含目标的待检测的连续帧图像;利用第一前馈神经网络,获取所述连续帧图像中的每一帧图像的第一特征信息;利用第二双向反馈神经网络,基于所述每一帧图像的第一特征信息,获取所述每一帧图像的第二特征信息;基于所述第二特征信息,确定所述连续帧图像的每一帧图像中包含目标的一个或多个区域,其中,所述每一帧图像的所述第二特征信息综合所述每一帧图像的预定数目的之前帧和之后帧的所述第二特征信息。2.如权利要求1所述的目标检测方法,还包括:基于所述第二特征信息,提取所述一个或多个区域的区域特征信息;以及基于所述区域特征信息,确定所述一个或多个区域中的目标的类别信息、属性信息和位置信息中的至少之一。3.如权利要求2所述的目标检测方法,还包括:基于所述属性信息和所述位置信息,确定处于所述连续帧图像中的同一目标,其中,所述位置信息包括之前帧、当前帧以及随后帧中的位置信息。4.如权利要求1到3的任一项所述的目标检测方法,其中,所述第一前馈神经网络为卷积前馈神经网络,所述第二双向反馈神经网络为双向反馈卷积神经网络,并且所述第一前馈神经网络和所述第二双向反馈神经网络分别包括一层或多层卷积神经网络。5.如权利要求1到3的任一项所述的目标检测方法,其中,利用第二双向反馈神经网络,基于所述每一帧图像的第一特征信息,获取所述每一帧图像的第二特征信息包括:利用所述第二双向反馈神经网络中的正向反馈神经网络,获取所述每一帧图像的正向特征信息;利用所述第二双向反馈神经网络中的反向反馈神经网络,获取所述每一帧图像的反向特征信息;以及综合所述正向特征信息和所述反向特征信息,获取所述第二特征信息,其中,所述正向特征信息反映当前帧及其之前预定数目帧的特征,并且所述反向特征信息反映当前帧及其之后预定数目帧的特征。6.如权利要求1到3的任一项所述的目标检测方法,其中,基于所述第二特征信息,确定所述连续帧图像的每一帧图像中包含目标的一个或多个区域包括:对于所述第二特征信息中的每个坐标点,输出预定数目的候选区域;基于所述候选区域对应的所述第二特征信息中的频道向量,确定所述候选区域包含目标的概率;以及确定所述概率满足预定阈值的所述候选区域作为所述包含目标的一个或多个区域。7.一种目标检测装置,包括:处理器;以及存储器,其中存储计算机可读程序指令,其中,在所述计算机可读程序指令被所述处理器运行时执行以下步骤:获取包含目标的待检测的连续帧图像;利用第一前馈神经网络,获取所述连续帧图像中的每一帧图像的第一特征信息;利用第二双向反馈神经网络,基于所述每一帧图像的第一特征信息,获取所述每一帧图像的第二特征信息;基于所述第二特征信息,确定所述连续帧图像的每一帧图像中包含目标的一个或多个区域,其中,所述每一帧图像的所述第二特征信息综合所述每一帧图像的预定数目的之前帧和之后帧的所述第二特征信息。8.如权利要求7所述的目标检测装置,其中,在所述计算机可读程序指令被所述处理器运行时还执行以下步骤:基于所述第二特征信息,提取所述一个或多个区域的区域特征信息;以及基于所述区域特征信息,确定所述一个或多个区域中的目标的类别信息、属性信息和位置信息中的至少之一。9.如权利要求8所述的目标检测装置,其中,在所述计算机可读程序指令被所述处理器运行时还执行以下步骤:基于所述属性信息和所述位置信息,确定处于所述连续帧图像中的同一目标,其中,所述位置信息包括之前帧、当前帧以及随后帧中的位置信息。10.如权利要求7到9的任一项所述的目标检测装置,其中,所述第一前馈神经网络为卷积前馈神经网络,所述第二双向反馈神经网络为双向反馈卷积神经网络,并且所述第一前馈神经网络和所述第二双向反馈神经网络分别包括一层或多层卷积神经网络。11.如权利要求7到9的任一项所述的目标检测装置,其中,在所述计算机可读程序指令被所述处理器运行时,利用第二双向反馈神经网络,基于所述每一帧图像的第一特征信息,获取所述每一帧图像的第二特征信息包括:利用所述第二双向反馈神经网络中的正向反...
【专利技术属性】
技术研发人员:张弛,姚昊天,印奇,
申请(专利权)人:北京旷视科技有限公司,北京迈格威科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。