The present invention relates to an object detection and matching method based on a pooling model of twin regions of interest. A pooling model of twin regions of interest, which combines the full convolution network structure and the pooling layer of the region of interest, is used. A full convolution network structure is adopted to accommodate input cells of different sizes. The network abstracts discriminant features layer by layer, and introduces the correlation convolution layer to determine the similarity between the target frame and the current video frame, and outputs the response graph of the corresponding position of the target frame in the current video frame. The invention can detect well in complex situations.
【技术实现步骤摘要】
一种基于孪生-感兴趣区域池化模型的物体检测与匹配方法
本专利技术涉及目标检测领域,特别是一种基于孪生-感兴趣区域池化模型的物体检测与匹配方法。
技术介绍
目标检测是从图像序列中将变化的区域从背景图像中提取出来,从而检测出运动的目标。在医疗诊断方面,目标检测可以有效地分析器官、细胞的运动,为医生提供了辅助诊断信息;在智能交通方面,目标检测可以为车流量统计、行人违规行为检测、车辆超速监测、交通拥堵分析等提供有力的技术支持;在人机交互方面,目标检测为人类提供了一种新的与电脑非接触、灵活的交互方式,例如通过捕捉手势的运动轨迹进而识别以产生输入信息;在自动驾驶方面,可以采用目标检测技术检测并跟踪当前行车前方的行人、车辆和动物等,通过实时收集与目标之间的距离信息控制制动装置以实现车辆在安全行车范围,可以减少事故发生概率。目标检测的效果会影响目标对象的分类、行为识别等一些后期处理。所以目标检测十分重要。下面介绍一下一些常用的动态视频目标检测与匹配的方法:背景减除:背景减除方法是目前运动检测中最常用的一种方法,它是利用当前图像与背景图像的差分来检测出运动目标的一种技术。它一般能够提供相对来说比较全面的运动目标的特征数据,但对于动态场景的变化,如光线照射情况和外来无关事件的干扰等也特别敏感。由于该模型是固定的,一旦建立之后,对于该场景图像所发生的任何变化都比较敏感,比如阳光照射方向,影子,树叶随风摇动等。时间差分:时间差分方法充分利用了视频图像的特征,从连续得到的视频流中提取所需要的动态目标信息。在一般情况下采集的视频图像,若仔细对比相邻两帧,可以发现其中大部分的背景像素均 ...
【技术保护点】
1.一种基于孪生‑感兴趣区域池化模型的物体检测与匹配方法,其特征在于:包括以下步骤:步骤S1:将初始帧和候选样本帧输入全卷积网络获取判别性特征;步骤S2:引入相关卷积层用于判定目标框与当前视频帧的特征相似性并输出目标框在当前视频帧中对应位置的响应图;步骤S3:添加ROI Pooling层以应用于目标检测。
【技术特征摘要】
1.一种基于孪生-感兴趣区域池化模型的物体检测与匹配方法,其特征在于:包括以下步骤:步骤S1:将初始帧和候选样本帧输入全卷积网络获取判别性特征;步骤S2:引入相关卷积层用于判定目标框与当前视频帧的特征相似性并输出目标框在当前视频帧中对应位置的响应图;步骤S3:添加ROIPooling层以应用于目标检测。2.根据权利要求1所述的一种基于孪生-感兴趣区域池化模型的物体检测与匹配方法,其特征在于:所述步骤S1具体包括以下步骤:步骤S11:获取初始帧和候选样本帧;步骤S12:构建全卷积网络,把初始帧和候选帧输入全卷积网络,获取判别性特征;其中,所述全卷积网络为深度卷积神经网络。3.根据权利要求2所述的一种基于孪生-感兴趣区域池化模型的物体检测与匹配方法,其特征在于:所述深度卷积神经网络的结构如下:第一层为卷积层,用以获取低层特征,该层的卷积核尺寸为11×11,卷积核个数为96,步长为2;输出经过正则化函数BatchNormalization正则化;第二层为最大池化层,用以降低特征维度,防止模型过拟合;池化层尺寸为3×3,步长为2;第三层也为卷积层,用以获取抽象特征,该层的卷积核尺寸为5×5,卷积核个数为256,步长为1;输出经过正则化函数BatchNormalization正则化;第四层为最大池化层,用以降低特征维度;该层的池化层尺寸为3×3,步长为1;第五层、第六层、以及第七层均为卷积层,...
【专利技术属性】
技术研发人员:余春艳,林晖翔,陈吕财,郭文忠,
申请(专利权)人:福州大学,
类型:发明
国别省市:福建,35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。