The invention discloses an automatic learning method of a downlink human detector for a specific scene based on deep network enhancement. The steps are: training the first neural network and the second neural network with a general data set on the server side, deploying the second neural network to the embedded device, and image of the current scene through the embedded device. The new image samples are captured and transmitted to the server. The new image samples are tested by the first neural network trained before and labeled according to the test scores. The size of the current pedestrian detection frame is estimated, and the size of the detection frame and the estimation in the positive samples are eliminated. The second neural network is tuned on the server side, and the optimized second neural network model is redeployed from the server side to the embedded device. The invention can quickly acquire accurate pedestrian detection models in specific scenarios.
【技术实现步骤摘要】
基于深度网络增强的特定场景下行人检测器自动学习方法
本专利技术涉及视频监控中行人检测研究领域,特别涉及一种基于深度网络增强的特定场景下行人检测器自动学习方法。
技术介绍
随着摄像头监控范围的逐步扩大,怎么利用摄像头采集到的数据分析行人的行为、动作、轨迹已经成为当今社会的一个急切的需求,而这些需求的技术基础则是行人检测。行人检测由行人检测器来完成,行人检测器的任务是对当前场景下行人的位置进行估计,其在行人跟踪、行人识别等摄像头监控领域具有非常重要的作用。由于光照变化、摄像头角度变化、行人姿势变化等因素,行人检测到目前仍然是一个十分具有挑战性的问题。近年来在这方面有了非常大的进步,包括传统的HOG特征以及SVM分类器应用在行人检测已经取得不错的效果,最近的基于卷积神经网络的研究由于对于样本分布有着比较好的学习能力,因此更是将行人检测器的性能推进到了一个新的高度。然而,尽管当前这些研究都可以在行人检测这个问题上取得非常好的效果,但是这些基于学习的方法训练得到的行人检测器效果很大程度依赖训练集的分布,因此在另外的特定场景下工作时,由于测试集的分布和训练集的分布有着非常大的差异,这些差异可能来自场景的遮挡、图像质量等等,行人检测器的性能将会变得很不理想。另一方面,如果采取人工标注的方法去采集每一个特定场景下的数据来对模型进行训练的话,这样无疑是非常浪费人力的,当行人检测器的数量非常大的时候,这样的方法是不可取的。因此,如何利用自动学习方法来提高行人检测器对于特定场景下的适应能力是一个关键性问题。现有的方法主要有以下几类的方法:(1)基于上下文信息、行人大小的方法。参 ...
【技术保护点】
1.基于深度网络增强的特定场景下行人检测器自动学习方法,其特征在于,包括步骤:(1)在服务器端使用通用的数据集训练出第一神经网络和第二神经网络,第二神经网络用于部署到嵌入式设备中;(2)通过嵌入式设备在进行行人检测的工作过程中,对当前场景的图像进行捕捉,获得新增图像样本,传送到服务器端;(3)在服务器端利用之前训练好的第一神经网络对新增图像样本进行测试,利用第一神经网络的测试得分对样本进行标注;(4)对嵌入式设备当前高度下行人检测框的大小进行估计,计算正样本中检测框和估计的行人检测框的差异值,若差异值超过阈值,则进行剔除,保留剩余样本;(5)服务器端利用上述剩余样本对第二神经网络进行调优;(6)将调优后的第二神经网络模型从服务器端重新部署到嵌入式设备中。
【技术特征摘要】
1.基于深度网络增强的特定场景下行人检测器自动学习方法,其特征在于,包括步骤:(1)在服务器端使用通用的数据集训练出第一神经网络和第二神经网络,第二神经网络用于部署到嵌入式设备中;(2)通过嵌入式设备在进行行人检测的工作过程中,对当前场景的图像进行捕捉,获得新增图像样本,传送到服务器端;(3)在服务器端利用之前训练好的第一神经网络对新增图像样本进行测试,利用第一神经网络的测试得分对样本进行标注;(4)对嵌入式设备当前高度下行人检测框的大小进行估计,计算正样本中检测框和估计的行人检测框的差异值,若差异值超过阈值,则进行剔除,保留剩余样本;(5)服务器端利用上述剩余样本对第二神经网络进行调优;(6)将调优后的第二神经网络模型从服务器端重新部署到嵌入式设备中。2.根据权利要求1所述的基于深度网络增强的特定场景下行人检测器自动学习方法,其特征在于,步骤(1)中,在服务器端使用通用的数据集训练出第一神经网络和第二神经网络的步骤是:利用在除了当前场景外的其他多个场景下人工标注的数据作为通用的数据集,使用基于ResNet-101的FasterR-CNN作为第一神经网络,采用基于AlexNet的SSD作为第二神经网络。3.根据权利要求2所述的基于深度网络增强的特定场景下行人检测器自动学习方法,其特征在于,所述第一神经网络、第二神经网络在训练时采用的预训练网络,其网络参数的获取方法为:在ImageNet上训练得到用于分类的网络参数,将最后的卷积层之后的层去除后,取剩下的卷积层的参数作为当前训练时候的初始化参数。4.根据权利要求1所述的基于深度网络增强的特定场景下行人检测器自动学习方法,其特征在于,步骤(2)中,嵌入式设备使用FTP协议将新增图像样本传送到服务器端。5.根据权利要求1所述的基于深度网络增强的特定场景下行人检测器自动学习方法,其特征在于,通过嵌入式设备在进行行人检测的工作过程中,对采集的图像样本进行筛选,步骤是:设定当前设备检测到的行人数量为Np,若Np≥Tp,Tp为预设定的阈值,则将采集的图像作为新增图像样本...
【专利技术属性】
技术研发人员:郑慧诚,何炜雄,谢晓华,
申请(专利权)人:中山大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。