【技术实现步骤摘要】
一种基于目标域伪标签的自监督跨域人群计数方法
[0001]本专利技术涉及计算机视觉、图形处理
,具体地说是一种基于目标领域内特定知识进行自监督训练的跨域人群计数方法。
技术介绍
[0002]人群计数的研究在现实生活中有重要的社会意义和广泛的应用前景,随着中国人口的显著增长,各大人群集聚活动不断增多,社会对精确密集人群计数研究的需求场景也不断增加。如利用人群计数方法可为地铁站、商场、体育场等公共场所的安全预警提供有效指导,尤其在COVID
‑
19疫情期间,人群计数方法可以在人员密集区的监控和自动报警上发挥作用。
[0003]随着计算机视觉技术的持续发展,人群计数领域涌现出了大量方法。传统的人群计数方法主要有以下几类:1)基于检测的方法,使用一个移动窗口式检测器来识别图像中的人,并计算出有多少人。该方法需要效果良好的分类器来提取低层次特征,在人脸检测方面效果很好,但在人群更为密集的图像上效果不佳。因为它存在检测目标的下限,当图片中人群目标较小的时候,基于检测的方法并不十分有效。2)基于回归的方法, ...
【技术保护点】
【技术特征摘要】
1.一种基于目标域伪标签的自监督跨域人群计数方法,其特征在于采用多级特征响应分支的两阶段领域自适应方法,利用伪标签在目标域进行自监督学习,得到实际场景中应用的计数模型,具体包括如下步骤:步骤1:将有标注信息的源域图像和无标注信息的目标域图像,交替输入到多级特征响应分支进行跨域网络训练,且共同学习源域和目标域之间的域共享知识,所述有标注信息的源域图像为GTA5游戏引擎自动生成的仿真人群图像,其人头位置由电脑自动标注;所述目标域图像为真实世界中采集的不包含任何标注信息的人群图像;所述跨域网络由编码器、多级特征解码分支和鉴别器组成;步骤2:将无标注信息的目标域图像输入步骤1中训练好的跨域网络中,利用多级特征解码分支模块为目标域生成鲁棒的伪标签;步骤3:将步骤2中得到的伪标签作为监督信息,对无标注信息的目标域数据利用伪标签进行微调,重新训练跨域网络,以加强跨域网络在目标域的适应性;步骤4:将待测试的目标域的图像输入到步骤3训练好的高分辨率人群计数网络,得到图像的人群密度图,计算密度图中所有像素的和为最终的人群计数结果。2.根据权利要求1所述基于目标域伪标签的自监督跨域人群计数方法,其特征在于所述第一阶段训练中设定网络的损失函数由下述a式表述:L
S1
(F
h
,F
m
,F
l
,F
f
,D
h
,D
m
,D
l
,D
f
)=L
den
+λL
adv
ꢀꢀꢀꢀ
(a);其中:L
S1
为第一阶段训练中跨域网络的总损失;L
den
为模型输入为源域图像时的密度估计损失;λ表示输入为目标域图像的跨域对抗损失的权重,其取值范围为[0.01,0.001];L
adv
表示模型输入为目标域图像时的跨域对抗损失;F
h
、F
m
、F1、F
f
分别为高级、中级、低级特征解码器和特征融合网络;D
h
、D
m
、D1、D
f
分别为高级、中级、低级特征鉴别器和融合特征鉴别器。3.根据权利要求1所述基于目标域伪标签的自监督跨域人群计数方法,其特征在于所述编码器由VGG
‑
16网络的前13层(Conv1
‑
Conv4)组成,并移除了Conv4中最后一个最大池化层,将图像输入到编码器中,得到E
l
、E
m
和E
h
三个不同级别的人群特征图,其分辨率为原图1/2、1/4和1/8;通道数分别为128、256和512。4.根据权利要求1所述基于目标域伪标签的自监督跨域人群计数方法,其特征在于所述多级特征解码分支包含高级特征解码器、中级特征解码器、低级特征解码器和融合网络,不同等级的特征解码器F,均由5个卷积层和1个上采样层组成,卷积层前4层卷积核大小为3*3,第5层为l*l,步长均为1,所述高级特征解码器的通道数分别为512、256、128、64和1,其上采样率为8;所述中级特征解码器的通道数分别为256、256、128、64和1,上采样率为4;所述低级特征解码器的通道数分别为128、128、128、64和1,上采样率为2;所述融合网络由2个3*3的卷积...
【专利技术属性】
技术研发人员:何高奇,王长波,蔡一庆,马振伟,陈梁港旭,吕长虹,
申请(专利权)人:华东师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。