一种单阶段半监督图像人体目标检测方法技术

技术编号:24757614 阅读:81 留言:0更新日期:2020-07-04 09:29
本发明专利技术公开了一种单阶段半监督图像人体目标检测方法,该方法是从视频帧中选取少量有真实标签的图像,剩下其它视频帧作为无真实标签图像;两类图像同时送入深度网络中训练网络;训练过程会有所不同,带有真实标签图像可以正常训练,但是无真实标签图像无法正常训练,所以会先通过网络获得高置信度的位置信息作为无真实标签图像的临时标签,然后再进行正常的训练;为了能够使网络不被临时标签的图像带偏,通过后续筛选和权重设置加以限制;直到网络模型训练到预先设定的次数。本发明专利技术方法是同时训练两类图像,只需要一个阶段,节约大量的时间成本。

A single stage semi supervised human object detection method

【技术实现步骤摘要】
一种单阶段半监督图像人体目标检测方法
本专利技术涉及计算机视觉的
,尤其是指一种单阶段半监督图像人体目标检测方法。
技术介绍
行人检测是利用计算机视觉技术识别图像或者视频帧中是否存在行人并给予精确定位。该技术应用领域广泛,可与行人跟踪、行人重识别等技术结合,能够很好地应用于人工智能系统、车辆辅助驾驶系统、智能视频监控、人体行为分析、智能交通等现实场景领域。由于行人一些独特的特性,外观易受穿着颜色、尺度、遮挡、姿态和视角等多方面影响,使得行人检测成为计算机视觉领域中一个不仅具有研究价值而且又极具挑战性的热门研究课题。半监督学习是模式识别领域和机器学习领域研究的重点问题,也是有监督学习与无监督学习相结合的一种学习方法。半监督学习使用大量的无真实标签数据,同时使用少量真实标签数据,来进行模式识别工作。当使用半监督学习时,将会要求尽量少的人员来从事工作,同时,又能够带来比较高的准确性,因此,半监督学习目前正越来越受到人们的重视。基于统计学习的方法根据大量的图像构建行人检测分类器。提取的特征主要有目标的灰度、边缘、纹理、颜色本文档来自技高网...

【技术保护点】
1.一种单阶段半监督图像人体目标检测方法,其特征在于,包括以下步骤:/nS1、对视频帧数据进行划分,分有真实标签图像集合

【技术特征摘要】
1.一种单阶段半监督图像人体目标检测方法,其特征在于,包括以下步骤:
S1、对视频帧数据进行划分,分有真实标签图像集合无真实标签图像集合和测试数据集合
S2、从无真实标签图像集合中获取一张无真实标签图像经过VGG16网络和RPN网络得到预测的位置坐标信息和相应的得分信息,将高置信度的位置坐标信息和得分信息送入到IoU网络,得到预测交并比信息,选取预测交并比大于或等于预定阈值的人体框预测信息作为该无真实标签图像的临时标签;
S3、输入两张图像到整个网络的入口,该整个网络是由VGG16、RPN和IoU三个网络组成,记为网络VGG16+RPN+IoU,其中一张为步骤S2的无真实标签图像另一张为从真实标签图像集合种获取的真实标签图像用于当前一轮的训练,用损失函数进行约束;
S4、重复步骤S2-S3,达到预先设定训练次数后完成训练;
S5、用测试数据集合对训练好的完整网络VGG16+RPN+IoU进行测试评估,得到人体目标检测的结果。


2.根据权利要求1所述的一种单阶段半监督图像人体目标检测方法,其特征在于:在步骤S1中,需要对视频帧的图像进行缩放处理,以期达到理想的训练效果和减少数据运算量;根据需要对视频帧数据进行分类,先把视频帧数据分为训练数据和测试数据集合两类;再将训练数据分为两类:真实标签图像集合和无真实标签图像集合的比例为1:19,即训练数据等于一张真实标签图像记为即一张无真实标签图像记为即


3.根据权利要求1所述的一种单阶段半监督图像人体目标检测方法,其特征在于:在步骤S2中,对无真实标签图像标注临时标签,对于整个网络模型VGG16+RPN+IoU,采取和测试阶段相同的模式,对参数进行固定,不进行更新;通过RPN网络获取分类信息和位置坐标信息,再选取高置信度的人体框通过IoU网络得到最后的IoU得分预测,选取IoU大于或等于预定阈值的人体框预测信息作为无真实标签图像的临时标签。


4.根据权利要求1所述的一种单阶段半监督图像人体目标检测方法,其特征在于:在步骤S3中,所述VGG16网络包含16个卷积层,分有5组;所述RPN网络包含一个3×3卷积核的卷积层和两个分别用来预测分类与位置坐标信息的卷积层,所述IoU网络包括三个全连接层对预测人体框进行拟合,具体的训练过程如下:
S31、输入包含真实标签图像和无真实标签图像的图片I;
S32、图片I经过第一组64个通道卷积层,得到特征图F1,经过最大化池化层得到特征图F1';
S33、将特征图F1'经过第二组128个通道卷积层,得到特征图F2,经过最大化池化层得到特征图F2';
S34、将特征图F2'经过第三组256个通道卷积层,得到特征图F3,经过最大化池化层得到特征图F3';
S35、将特征图F3'经过第四组512个通道卷积层,得到特征图F4,经过最大化池化层得到特征图F4';
S36、将特征图F4'经过第五组512个通道卷积层,得到特征图F5;
S37、将特征图F5经过RPN网络得到大小相同的特征图F5',然后通过分类和定位卷积层得到相应的输出C、B;其中,C为对应anchor预测的分类得分,B为对应anchor预测的人体框位置坐标信息;
S38、将步骤S37中得到的分类得分信息和位置坐标信息进行筛选,选取分类得分大于预定阈值的人体框作进一步的甄别;
S39、将步骤S38选取好的人体框在步骤S36中的特征图F5上挖取对应的特征图F;
S310、特征图F转换成向量f输入到IoU网络中,最后得到人体框对应的IoU预测。


5.根据权利要求4所述的一种单阶段半监督图像人体目标检测方法,其特征在于:在步骤S37中,预测的位置坐标信息记为ti=(ti,x,ti,y,ti,w,ti,h),ti,x为预测人体框中心横坐标,ti,y为预测人体框中心纵坐标,ti,w为预测人体框的宽,ti...

【专利技术属性】
技术研发人员:陈学贤吴斯
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1