一种基于对抗生成网络的目标计数方法技术

技术编号:19746290 阅读:25 留言:0更新日期:2018-12-12 04:55
一种基于对抗生成网络的目标计数方法,模型训练过程的步骤如下:步骤1.1:图片预处理,随机提取原图中若干图像块并缩放为相同大小;步骤1.2:设计鉴别模型,采用卷积神经网络计算图片置信度;步骤1.3:生成模型的设计,同样采用卷积神经网络生成所需密度图;步骤1.4:对抗生成网络的训练,设置两个损失函数L_D和L_G,采用Adam方法分别优化鉴别模型和生成模型;模型使用过程的步骤如下:步骤2.1:密度图的生成,根据训练模型使用生成模型生成密度图

【技术实现步骤摘要】
一种基于对抗生成网络的目标计数方法
本专利技术涉及深度学习、目标计数等领域,设计出的网络主要用于生成实现目标计数所需的密度图。
技术介绍
机器学习是一门多领域交叉学科,涉及概率论、统计学等多门学科。通过模拟人类的学习行为使计算机能够不断进行自我完善,最终达到比较好的性能,深度学习作为机器学习方法中的一种,其强大的学习能力解决了许多问题,得到了学者们广泛的认可。目标计数可以应用于生活工作的很多方面,例如交通部门对车流量的监控,社交场所的人流量统计等等。现在有很多基于计算机视觉的方法来实现目标计数,但精度仍有待提高,尤其是在复杂环境下,如目标存在互相遮挡,粘连,部分可见等情况下的精确计数仍是一个难题。因此急需一种适用于复杂环境并且拥有较高的精度的目标计数方法,以便在现实场景中更好的运用计算机视觉来实现目标计数。要设计出这样的一个方法,关键是设计一个学习能力较强的网络,能够准确识别场景中的目标,从而提升目标计数的准确率。
技术实现思路
为了克服复杂环境下精确计数的问题,本专利技术提出一种基于对抗生成网络的网络架构,该网络架构采用生成模型与鉴别模型以博弈的方式相互优化,从而获得精度较高的密度图。本专利技术解决其技术问题所采用的技术方案是:一种基于对抗生成网络的目标计数方法,所述方法包括模型训练过程和模型使用过程;模型训练过程的步骤如下:步骤1.1:图片预处理,随机提取原图中若干图像块并缩放为相同大小;步骤1.2:设计鉴别模型,采用卷积神经网络计算图片置信度;步骤1.3:生成模型的设计,同样采用卷积神经网络生成所需密度图;步骤1.4:对抗生成网络的训练,设置两个损失函数L_D和L_G,采用Adam方法分别优化鉴别模型和生成模型;模型使用过程的步骤如下:步骤2.1:密度图的生成,根据训练模型使用生成模型生成密度图步骤2.2:目标计数,根据公式(1)计算目标数量Num:其中p为各像素值。进一步,所述步骤1.1中,记一个训练集序列为(S0,S1,S2,……,Sm),以S0为例,在S0中取n个图像块(P1,P2,P3,……,Pn),取1-2个效果最好,将(S0,P1,P2,P3,……,Pn)缩放成相同的大小,作为生成模型输入。再进一步,所述步骤1.2中,鉴别模型共有5层,前4层为卷积层,卷积核大小均为5×5,步长为2,输出通道分别为64,128,256,512,其中第一层后接激活函数为lrelu,2-4层先经batchnormalization后再接lrelu激活函数,最后一层为全连接层,最终通过sigmoid函数输出表示输入图片来自真实数据库的概率值。所述步骤1.3中,生成模型共有9层,前五层为卷积层,前两层的卷积核为7×7,输出32个通道,并各后接一个最大池化层,第三层的卷积核为5×5,输出32个通道,并后接一个最大池化层,后两层的卷积核为1×1,第四层输出1000个通道,第五层输出400个通道,然后将各个图像块的卷积层输出组合后输入四层全连接层,前两个全连接层输出512个通道,第8层全连接层输出为324个通道,并resize为18×18大小。所述步骤1.4中,设置两个损失函数L_D和L_G,其中L_D为鉴别模型的损失函数,L_G为生成模型的损失函数,过程如下:步骤1.4.1:对于生成模型,将(S0,P1,P2,P3,……,Pn)输入生成模型中,得到预测的密度图步骤1.4.2:其次,由于经过池化使得图片缩小,因此要将密度图缩放为原图大小,并通过下式(2)进行归一化;其中p表示像素点;步骤1.4.3:对于鉴别模型,我们将以原密度图为输入得到的概率值记为D(X),将以生成模型生成的图像作为输入得到的概率值记为步骤1.4.4:将训练集图片随机打乱并依次输入网络中,采用Adam优化方法间隔训练鉴别模型和生成模型,其中训练生成模型时为防止改变鉴别模型参数,鉴别部分通过参数共享的方式沿用鉴别模型参数,设置迭代次数,鉴别模型与生成模型损失函数分别如下式(3)(4),迭代结束后保存最终生成的模型数据;其中E表示求均值,优化参数使L_D达到最大值,使L_G达到最大值。本专利技术的技术构思为:所述基于对抗生成网络的目标计数方法采用生成模型获取密度图,同时相对一般的生成模型,以对抗的方式进行训练可以使生成模型能够达到更好的效果,使输出的密度图更准确,同时提升网络的通用性,在复杂环境中目标之间存在遮挡、粘连等情况时也能达到较高的精度。本专利技术的有益效果主要表现在:可以获得精度更高,通用性更好的密度图,使网络在计数目标存在相互遮挡、粘连等情况下的计数也更准确。附图说明图1为本专利技术的网络的生成模型。图2为本专利技术的网络的鉴别模型。具体实施方式下面结合附图对本专利技术作进一步描述。参照图1和图2,一种基于对抗生成网络的目标计数方法,所述方法包括模型训练过程和模型使用过程;模型训练过程的步骤如下:步骤1.1:图片预处理,随机提取原图中若干图像块并缩放为相同大小;步骤1.2:设计鉴别模型,采用卷积神经网络计算图片置信度;步骤1.3:生成模型的设计,同样采用卷积神经网络生成所需密度图;步骤1.4:对抗生成网络的训练,设置两个损失函数L_D和L_G,采用Adam方法分别优化鉴别模型和生成模型;模型使用过程的步骤如下:步骤2.1:密度图的生成,根据训练模型使用生成模型生成密度图步骤2.2:目标计数,根据公式(1)计算目标数量Num:其中p为各像素值。进一步,所述步骤1.1中,记一个训练集序列为(S0,S1,S2,……,Sm),以S0为例,在S0中取n个图像块(P1,P2,P3,……,Pn),取1-2个效果最好,将(S0,P1,P2,P3,……,Pn)缩放成相同的大小,作为生成模型输入。再进一步,所述步骤1.2中,鉴别模型共有5层,前4层为卷积层,卷积核大小均为5×5,步长为2,输出通道分别为64,128,256,512,其中第一层后接激活函数为lrelu,2-4层先经batchnormalization后再接lrelu激活函数,最后一层为全连接层,最终通过sigmoid函数输出表示输入图片来自真实数据库的概率值。所述步骤1.3中,生成模型共有9层,前五层为卷积层,前两层的卷积核为7×7,输出32个通道,并各后接一个最大池化层,第三层的卷积核为5×5,输出32个通道,并后接一个最大池化层,后两层的卷积核为1×1,第四层输出1000个通道,第五层输出400个通道,然后将各个图像块的卷积层输出组合后输入四层全连接层,前两个全连接层输出512个通道,第8层全连接层输出为324个通道,并resize为18×18大小。所述步骤1.4中,设置两个损失函数L_D和L_G,其中L_D为鉴别模型的损失函数,L_G为生成模型的损失函数,过程如下:步骤1.4.1:对于生成模型,将(S0,P1,P2,P3,……,Pn)输入生成模型中,得到预测的密度图步骤1.4.2:其次,由于经过池化使得图片缩小,因此要将密度图缩放为原图大小,并通过下式(2)进行归一化;其中p表示像素点;步骤1.4.3:对于鉴别模型,我们将以原密度图为输入得到的概率值记为D(X),将以生成模型生成的图像作为输入得到的概率值记为步骤1.4.4:将训练集图片随机打乱并依次输入网络中,采用Adam优化方法间隔训练鉴别模型和生成模型,本文档来自技高网...

【技术保护点】
1.一种基于对抗生成网络的目标计数方法,其特征在于,所述方法包括模型训练过程和模型使用过程;模型训练过程的步骤如下:步骤1.1:图片预处理,随机提取原图中若干图像块并缩放为相同大小;步骤1.2:设计鉴别模型,采用卷积神经网络计算图片置信度;步骤1.3:生成模型的设计,同样采用卷积神经网络生成所需密度图;步骤1.4:对抗生成网络的训练,设置两个损失函数L_D和L_G,采用Adam方法分别优化鉴别模型和生成模型;模型使用过程的步骤如下:步骤2.1:密度图的生成,根据训练模型使用生成模型生成密度图

【技术特征摘要】
1.一种基于对抗生成网络的目标计数方法,其特征在于,所述方法包括模型训练过程和模型使用过程;模型训练过程的步骤如下:步骤1.1:图片预处理,随机提取原图中若干图像块并缩放为相同大小;步骤1.2:设计鉴别模型,采用卷积神经网络计算图片置信度;步骤1.3:生成模型的设计,同样采用卷积神经网络生成所需密度图;步骤1.4:对抗生成网络的训练,设置两个损失函数L_D和L_G,采用Adam方法分别优化鉴别模型和生成模型;模型使用过程的步骤如下:步骤2.1:密度图的生成,根据训练模型使用生成模型生成密度图步骤2.2:目标计数,根据公式(1)计算目标数量Num:其中p为各像素值。2.如权利要求1所述的基于对抗生成网络的目标计数方法,其特征在于,所述步骤1.1中,记一个训练集序列为(S0,S1,S2,......,Sm),以S0为例,在S0中取n个图像块(P1,P2,P3,......,Pn),取1-2个效果最好,将(S0,P1,P2,P3,......,Pn)缩放成相同的大小,作为生成模型输入。3.如权利要求1或2所述的基于对抗生成网络的目标计数方法,其特征在于,所述步骤1.2中,鉴别模型共有5层,前4层为卷积层,卷积核大小均为5×5,步长为2,输出通道分别为64,128,256,512,其中第一层后接激活函数为lrelu,2-4层先经batchnormalization后再接lrelu激活函数,最后一层为全连接层,最终通过sigmoid函数输出表示输入图片来自真实数据库的概率值。4.如权利要求1或2所述的基于对抗生成网络...

【专利技术属性】
技术研发人员:郭东岩王俊崔滢王振华张剑华陈胜勇
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1