【技术实现步骤摘要】
本专利技术涉及计算机视觉、针对人头人体的目标检测等多个,更具体地,涉及一种面向泳池场景的轻量级人头人体检测方法。
技术介绍
1、自2012年alexnet在imagenet大规模图像分类竞赛中的突破性表现发端,深度学习技术迅速崛起。r-cnn系统作为深度学习进军目标检测领域的先驱,采用了ss(selectivesearch)方法来选取可能包含目标的候选区域,并通过固定尺寸调整后输入预先训练好的alexnet以抽取特征,随后运用svm分类器完成目标识别。尽管r-cnn在当时取得了显著成就,但其训练流程复杂,耗时较长,而且存在多环节独立训练的弊端。
2、后续研究者不断优化此流程,其中sppnet(空间金字塔池化网络)由he等学者提出,通过整合空间金字塔池化层至网络结构中,允许不经尺寸调整即能抽取不同尺寸和比例的特征,大幅提升了检测效率,然而依然保留了分阶段训练的特点。紧随其后,ross等人推出的fast r-cnn网络实现了分类与回归任务的一体化联合学习,采用softmax函数取代svm进行分类,并同步执行分类和边界框回归,大大
...【技术保护点】
1.一种面向泳池场景的轻量级人头人体检测方法,其特征在于,所述方法包括以下步骤:
2.如权利要求1所述的一种面向泳池场景的轻量级人头人体检测方法,其特征在于,所述步骤(1)中,使用摄像头对泳池场景进行视频拍摄同时抽帧以获取尺寸为1920*1080的图像数据,并对图像中的人头人体进行水平边界框标注,最终生成VOC格式的标注文件,将在训练中使用;同时,标注过程中还要标注是否存在反光、雾气噪声以及含有哪种噪声。
3.如权利要求1或2所述的一种面向泳池场景的轻量级人头人体检测方法,其特征在于,所述步骤(2)中,生成对抗神经网络GAN由生成器和判别器两部
...【技术特征摘要】
1.一种面向泳池场景的轻量级人头人体检测方法,其特征在于,所述方法包括以下步骤:
2.如权利要求1所述的一种面向泳池场景的轻量级人头人体检测方法,其特征在于,所述步骤(1)中,使用摄像头对泳池场景进行视频拍摄同时抽帧以获取尺寸为1920*1080的图像数据,并对图像中的人头人体进行水平边界框标注,最终生成voc格式的标注文件,将在训练中使用;同时,标注过程中还要标注是否存在反光、雾气噪声以及含有哪种噪声。
3.如权利要求1或2所述的一种面向泳池场景的轻量级人头人体检测方法,其特征在于,所述步骤(2)中,生成对抗神经网络gan由生成器和判别器两部分组成,它们通过对抗训练的方式相互竞争;细节上,生成器中输入不含噪声的泳池图像,输出尽可能与泳池环境中反光、雾气条件相似的含有噪声的图像;而判别器输入真实采集的含有噪声的图像和生成器中生成的噪声图像,然后将其分为真实数据和生成器中生成的数据,以帮助生成器生成的噪声图像更加逼真,不断重复这个步骤,以致生成器中生成判别器无法判别真假的图像为止。
4.如权利要求1或2所述的一种面向泳池场景的轻量级人头人体检测方法,其特征在于,所述步骤(3)中,基于深度可分离卷积的轻量级骨干网络采用了深度可分离卷积层来代替传统的卷积层,从而减少了计算量和模型大小;深度可分离卷积层由深度卷积层和逐点卷积层组成,前者只考虑每个通道内的空间关系,后者则只考虑每个位置的通道关系,这种分离的方式使得骨干网络可以用更少的参数和计算量来学习空间和通道的特征,从而减小了模型的大小和计算复杂度,它适合于泳池这种环境复杂,且需要低延迟快速响应的场景。
5.如权利要求1或2所述的一种面向泳池场景的轻量级人头人体检测方法,其特征在于,所述步骤(4)中,由于泳池场景下多个人头人体距离摄像头的远近不同,因此采集图像中的人头人体尺寸差距会较大,编码器...
【专利技术属性】
技术研发人员:胡宇翔,钱冠予,程强,崔滢,郭东岩,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。