This application provides a video object detection method based on ST SIN, which includes: convoluting and pooling the original frames of video using FCN algorithm to obtain corresponding spatial feature maps; LSTM algorithm to process each spatial feature map to obtain temporal spatial feature maps; RPN algorithm to process the temporal spatial feature maps to obtain the corresponding temporal spatial features of each ROI. Fig. Pooling the time and space feature maps corresponding to each ROI and processing the full connection layer to obtain the corresponding one-dimensional feature vectors of ROI, and processing the one-dimensional feature vectors of each ROI by SIN network to get the coordinates of the categories and corresponding frames of each ROI. The method also obtains the temporal characteristics of the corresponding receptive fields in each frame, which improves the accuracy of video object detection. The application also provides a video object detection system based on ST SIN, computer and computer readable storage media, all of which have the above beneficial effects.
【技术实现步骤摘要】
一种基于ST-SIN的视频物体检测方法及系统
本申请涉及计算机视觉领域,特别涉及一种基于ST-SIN的视频物体检测方法、系统、计算机及计算机可读存储介质。
技术介绍
计算机视觉在当今科技发展中占有重要意义,图像和视频检测更是被用到各行各业中,如安防,自动驾驶,医疗成像中。因此不断地追求检测的精度有着十分重要的意义。目前,视频物体检测的相关技术只在乎物体的空间特征信息,而忽略了其他信息的运用,结果导致视频物体检测的准确度不高。因此,如何提高视频物体检测的准确度是本领域技术人员需要解决的技术问题。
技术实现思路
本申请的目的是提供一种基于ST-SIN的视频物体检测方法、系统、计算机及计算机可读存储介质,能够提高视频物体检测的准确度。为解决上述技术问题,本申请提供一种基于ST-SIN的视频物体检测方法,包括:利用FCN算法对视频的各帧原图进行卷积和池化处理获取对应的空间特征图;对各个所述空间特征图进行LSTM算法处理得到时间-空间特征图;对所述时间-空间特征图进行RPN算法处理得到各个ROI对应的时间-空间特征图;对各个所述ROI对应的时间-空间特征图依次进行池化处理和全连接层处理获取对应的ROI一维特征向量;将各个所述ROI一维特征向量进行SIN网络处理得到各个所述ROI的类别及对应的框的坐标。优选地,该视频物体检测方法还包括:对各帧所述原图进行池化处理和全连接层处理获取对应的背景一维特征向量。优选地,对所述时间-空间特征图进行RPN算法处理得到各个ROI对应的时间-空间特征图之后,还包括:利用各个所述ROI对应的时间-空间特征图获取各个所述ROI之间的物体关系信 ...
【技术保护点】
1.一种基于ST‑SIN的视频物体检测方法,其特征在于,包括:利用FCN算法对视频的各帧原图进行卷积和池化处理获取对应的空间特征图;对各个所述空间特征图进行LSTM算法处理得到时间‑空间特征图;对所述时间‑空间特征图进行RPN算法处理得到各个ROI对应的时间‑空间特征图;对各个所述ROI对应的时间‑空间特征图依次进行池化处理和全连接层处理获取对应的ROI一维特征向量;将各个所述ROI一维特征向量进行SIN网络处理得到各个所述ROI的类别及对应的框的坐标。
【技术特征摘要】
1.一种基于ST-SIN的视频物体检测方法,其特征在于,包括:利用FCN算法对视频的各帧原图进行卷积和池化处理获取对应的空间特征图;对各个所述空间特征图进行LSTM算法处理得到时间-空间特征图;对所述时间-空间特征图进行RPN算法处理得到各个ROI对应的时间-空间特征图;对各个所述ROI对应的时间-空间特征图依次进行池化处理和全连接层处理获取对应的ROI一维特征向量;将各个所述ROI一维特征向量进行SIN网络处理得到各个所述ROI的类别及对应的框的坐标。2.根据权利要求1所述的视频物体检测方法,其特征在于,还包括:对各帧所述原图进行池化处理和全连接层处理获取对应的背景一维特征向量。3.根据权利要求1所述的视频物体检测方法,其特征在于,对所述时间-空间特征图进行RPN算法处理得到各个ROI对应的时间-空间特征图之后,还包括:利用各个所述ROI对应的时间-空间特征图获取各个所述ROI之间的物体关系信息。4.根据权利要求3所述的视频物体检测方法,其特征在于,对各个所述ROI对应的时间-空间特征图依次进行池化处理和全连接层处理获取对应的ROI一维特征向量之后,还包括:将各个所述ROI一维特征向量、所述背景一维特征向量和所述物体关系信息进行所述SIN网络处理得到各个所述ROI的类别及对应的框的坐标。5.一种基于ST-SIN的视频物体检测系统,其特征在于,包括:空间特征图获取模块,用于利用FCN算法对视频的各帧原图进行卷积和池化处理获取对应的空间特征图;LSTM算法处理模块,用于对各个所述空间特征图进...
【专利技术属性】
技术研发人员:黄国恒,朱俊文,邓桂扬,
申请(专利权)人:广东工业大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。