【技术实现步骤摘要】
一种基于深度学习图像语义分割的人数估计方法
本专利技术涉及图像处理与计算机视觉领域,特别涉及一种基于深度学习图像语义分割的人数估计方法。
技术介绍
人数估计在很多场景下均有应用价值,例如在公共安全方面,人群聚集过多易发生踩踏等事故,当人群密度达到一定规模则控制人数,例如在城市或商业规划方面,分析出感兴趣区域的人流量,高效规划商业布置;当然,如果能够确定区域内每个人所在的位置,就可以将更加细化的人群密度信息加以利用。现有技术中有较多人群密度或人数估计方法,例如专利号为CN201610536882的中国专利技术专利申请,名称为一种基于卷积神经网络的人群密度估计方法,该方法基于mixed-Pooling的卷积神经网络模型,最终得到的结果是某个区域的密度等级(中、高、低),而不能给出区域内的估计行人个数;又例如专利号为CN201210434490的中国专利技术专利申请,名称为一种可跨摄像机的自适应人群密度估计方法,该方法也不能给出区域内人数估计。上述方法不能给出区域内估计人数,但也有些专利方法可以给出估计人数,但大多都需要先进行图像分块,再进行例如特征提取等处理,例如专利 ...
【技术保护点】
一种基于深度学习图像语义分割的人数估计方法,其特征在于包括以下步骤:步骤1,构建训练样本集:采集待检测区域的视频图像,对每一张样本图片,标注出图像中的人头部位置,生成对应的掩码图片作为其标签,掩码图片中每个光圈点对应一个人头,原图及对应的标签掩码图作为训练样本集;步骤2,选择或构建基于图像语义分割的深度网络模型;步骤3,将样本集送入步骤2中确定的深度学习网络模型进行训练,得到适用于该数据集场景的模型,称为人头位置预测网络模型;步骤4,输入与训练样本图片长宽相同的待检测图片至步骤3中训练得到的人头位置预测网络模型,得到预测的掩码图片,根据掩码图片中光圈点的位置和光圈点的个数可 ...
【技术特征摘要】
1.一种基于深度学习图像语义分割的人数估计方法,其特征在于包括以下步骤:步骤1,构建训练样本集:采集待检测区域的视频图像,对每一张样本图片,标注出图像中的人头部位置,生成对应的掩码图片作为其标签,掩码图片中每个光圈点对应一个人头,原图及对应的标签掩码图作为训练样本集;步骤2,选择或构建基于图像语义分割的深度网络模型;步骤3,将样本集送入步骤2中确定的深度学习网络模型进行训练,得到适用于该数据集场景的模型,称为人头位置预测网络模型;步骤4,输入与训练样本图片长宽相同的待检测图片至步骤3中训练得到的人头位置预测网络模型,得到预测的掩码图片,根据掩码图片中光圈点的位置和光圈点的个数可得到待检测图片中的人数以及每个人的位置信息。2.如权利要求1所述的一种基于深度学习图像语义分割的人数估计方法,其特征在于,所述步骤1包括如下步骤:采集场景图片,缩放图片至合适长宽;处理后的图片即为训练样本集中的原图,在该图片上标注出人头部位置,并将每个人头部的坐标信息写入到一个文本文件中;生成一张与训练样本原图长宽相同的像素值全为0的二值掩码图片,从上述步骤中生成的文本文件中读取人头部位置并映射到该掩码图片上,而后采用高斯模糊方法让每个位置形成像素值为1的小光圈点,处理后的掩码图片即为原图片的标签。3.如权利要求2所述的一种基于深度学习图像语义分割的人数估计方法,其特征在于,所述步骤1中还包括一个步骤:在所述采集场景图片,缩放图片至合适长宽步骤后,滤除图片中的无关区域。4.如权利要求1所述的一种基于深度学习图像语义分割的人数估计方法,其特征在于,所述步骤2中采用的图像语义分割的深度网络模型为SegNet模型。5.如权利要求1所述的一种基于深度学习图像语义分割的人数估计方法,其特征在于,所述步骤2中采用的图像语义分割的深度网络模型为基于SegNet模型的改进模型。6.如权利要求5所述的一种基于深度学习图像语义分割的人数估计方法,其特征在于,基于原始SegNet模型的改进方法包括:(1)去除第五组卷积和下采样操作以及对应的上采样和反卷积操作;(2)减少每层卷积的通道数;(3)修改第三组和第四组的卷积操作,将这两组的每个卷积都替换为瓶颈结构;(4)去除Softmax层。7.如权利要求6所述的一种基于深度学习图像语义分割的人数估计方法,其特征在于,改进后的SegNet模型具体结构为:输入图像;第一组卷积...
【专利技术属性】
技术研发人员:林坚,
申请(专利权)人:南京行者易智能交通科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。