一种基于生成对抗网络的蚊群计数方法及系统技术方案

技术编号:37155116 阅读:24 留言:0更新日期:2023-04-06 22:16
本发明专利技术公开了一种基于生成对抗网络的蚊群计数方法及系统,方法包括如下步骤:1)数据集制作阶段:采集蚊群图像制作训练集和测试集,生成训练集的真值图;2)训练阶段:构建生成器网络和判别器网络,训练生成器网络和判别器网络;3)测试阶段:将测试集图像输入训练阶段训练完成的生成器网络中得到预测图;4)使用阶段:将待计数蚊群图输入到生成器网络中,得到预测数量和预测图。其中生成器部分由前端网络和后端网络构成,前端网络是由使用了公共数据集Imagenet预训练完的VGG

【技术实现步骤摘要】
一种基于生成对抗网络的蚊群计数方法及系统


[0001]本专利技术属于数字图像处理
,具体涉及一种基于生成对抗网络的蚊群计数方法及系统,其是一种在不同场景下对蚊虫进行计数的技术方案,其中生成对抗网络分为生成器和判别器两部分,生成器部分由前端网络和后端网络构成,其中前端网络是由使用了公共数据集Imagenet预训练完的VGG

16前十层构成;后端网络是融入注意力机制的多尺度卷积神经网络构成,判别器部分由马尔科夫判别器构成。

技术介绍

[0002]当下随着二氧化碳排放超标,全球变暖的迹象日益明显,蚊类昆虫变得越来越活跃,感染蚊媒传染病的风险也随之升高。蚊媒传染病是指以蚊虫为传播媒介,通过蚊虫叮咬传播病原体的疾病。媒介蚊虫的监测和控制是阻断蚊媒传染病传播,遏制其流行的重要途径,其中蚊群数量的统计是监测的重要环节。但是目前现有的蚊群计数方法如人诱法、人工小时法主要依靠人工计数,工作量大且效率低下,并且操作人员容易被叮咬,存在一定的感染风险。所以,研究一种在低误差率下快速对蚊群进行自动计数技术具有重要的实际意义
专利技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于生成对抗网络的蚊群计数方法,其特征是包括如下步骤:1)数据集制作阶段:采集蚊群图像制作训练集和测试集,生成训练集的真值图;2)训练阶段:构建生成器网络和判别器网络,迭代训练生成器网络和判别器网络;3)测试阶段:将测试集图像输入训练阶段获得的生成器网络中得到预测数量和预测图;4)使用阶段:将待计数蚊群图输入到训练阶段和测试阶段完成的生成器网络中,得到预测数量和预测图。2.如权利要求1所述基于生成对抗网络的蚊群计数方法,其特征是:步骤1)数据集制作阶段具体按如下步骤:步骤1.1)收集蚊群图像制作训练集和测试集:采集蚊群图像集,按照图像中蚊子所占像素块多少将训练集分为8类,以蚊子区域中心为圆心作圆,将直径小于10个像素块的图像定义为第1类,将直径占11到14个像素块的图像定义为第2类,将直径占15到18个像素块的图像定义为第3类,将直径占19到22个像素块的图像定义为第4类,将直径占23到26个像素块的图像定义为第5类,将直径占27到30个像素块的图像定义为第6类,将直径占31到34个像素块的图像定义为第7类,将直径大于35个像素块的图像定义为第8类;图像尺寸为960
×
540;从采集获得的图像中,随机抽取70%的图像组成训练集,剩余图像组成测试集;步骤1.2)生成训练集的真值图:建立与原图大小相同的二维稀疏矩阵,将该矩阵与原图中蚊子的中心像素对应位置的数值人工标记为1,其余位置的值均为0;将标记后的矩阵与高斯核函数进行卷积,高斯核函数的定义公式(1):其中x是平面内任意一点,x
i
是二维矩阵中值为1的点,σ是控制高斯核函数的作用范围,其值越大表示高斯核作用范围就越大;训练集的8类图像分别对应的高斯核函数中σ的取值从2至9,具体对应关系为第1类对应σ的值大小为2,第2类对应σ的值大小为3,以此类推,得到训练集真值图;真值图表示为公式(2):其中N为二维矩阵中值为1的点的总数,σ
k
代表第k类蚊群图群图(k=1,2,...,8)的高斯核的大小,δ(x

x
i
)为冲击函数,作用是筛选出值为1的点x
i
的位置。3.如权利要求2所述基于生成对抗网络的蚊群计数方法,其特征是:步骤2)训练阶段具体按如下步骤:步骤2.1)构建生成器网络:所述的生成器网络由前端网络、注意力网络模块、后端网络和输出层组成;所述的前端网络由使用了公共数据集Imagenet预训练完的VGG

16前十层构成,具体由十个卷积层和三个最大池化层构成,每个卷积层的卷积核大小均为3
×
3且卷积核滑动步长均为1;最大池化层窗口大小为2
×
2且卷积核滑动步长均为2;第一卷积层通道数为64,后接一个ReLU激活函数;第二卷积层通道数为64,后接一个ReLU激活函数;在第二卷积层后接一个最大池化层;第三卷积层通道数为128,后接一个ReLU激活函数;第四卷积层通道数为128,后接一个ReLU激活函数;在第四卷积层后接一个最大池化层;第五卷积层通道数为256,后接一个ReLU激活函数;第六卷积层通道数为256,后接一个ReLU激活函数;
第七卷积层通道数为256,后接一个ReLU激活函数;在第七卷积层后接一个最大池化层;第八卷积层通道数为512,后接一个ReLU激活函数;第九卷积层通道数为512,后接一个ReLU激活函数;第十卷积层通道数为512,后接一个ReLU激活函数;所述的注意力网络模块依次由全局平均池化层、第一全连接层、ReLU激活层、第二全连接层和Sigmoid层组成;第一全连接层的神经元个数为C/r,C为输入特征图的通道数本模块中C的值为512,本模块中r的值为16;第二全连接层的神经元个数为C;卷积模块对图像计算得到的特征图,通过注意力网络模块计算后得到特征图各个通道的权重值,将权重和对应的各个通道一一相乘得到带权重的特征图;注意力网络加载到前端网络之后,后端网络的第三路之前;所述的后端网络为三路结构,第一路由三个卷积层构成,其中每个卷积层的卷积核大小均为3
×
3,第一个卷积层卷积核通道数为256,后接BN归一化函数和ReLU激活函数;第二个卷积层卷积核通道数为128,后接BN归一化函数和ReLU激活函数;第三个卷积层卷积核通道数为64,后接BN归一化函数和ReLU激活函数;所有卷积核滑动步长为1;第二路由三个卷积层构成,其中每个卷积层的卷积核大小均为5
×
5,第一个卷积层卷积核通道数为256,后接BN归一化函数和ReLU激活函数;第二个卷积层卷积核通道数为128,后接BN归一化函数和ReLU激活函数;第三个卷积层卷积核通道数为64,后接BN归一化函数和ReLU激活函数;所有卷积核滑动步长为2;第三路由三个卷积层构成,其中每个卷积层的卷积核大小均为7
×
7,第一个卷积层卷积核通道数为256,后接BN归一化函数和ReLU激活函数;第二个卷积层卷积核通道数为128,后接BN归一化函数和ReLU激活函数;第三个卷积层卷积核通道数为64,后接BN归一化函数和ReLU激活函数;所有卷积核滑动步长为3;所述的输出层由一个卷积层构成,卷积层卷积核大小为1
×
1,通道数为1,卷积核滑动步长为1,该层作用是输出预测图;步骤2.2)构建判别器网络:所述的判别器网络是马尔科夫判别器网络,具体由一个连接层和五个卷积层构成,每个卷积层的卷积核都为4
×
4,卷积核滑动步长均为2;第一卷积层通道数为64,后接一个LeakyReLU激活函数;第二卷积层通道数为128,后接BN归一化函数和LeakyReLU激活函数;第三卷积层通道数为256,后接BN归一化函数和LeakyReLU激活函数;第四卷积层通道数为512,后接BN归一化函数和LeakyReLU激活函数;第五卷积层通道数为1;步骤2.3)训练生成器网络:将步骤1.1)中的蚊群训练集图像作为步骤2.1)中生成器网络的输入图像;网络采用随机梯度下降法作为优化器,其中参数学习率为1e

7,动量为0.95,权重衰减为5*1e

4,总共训练20次;使用损失函数评价生成器网络输出的预测图与真值图之间的误差,所述损失函数定义为公式(3):其中损失函数Loss
G
代表生成器网络中输出预测图和步骤1.2)中真值图之间的损失值,M1代表训练的图像数量,X
i
代表输入的图像,C(X
i
)表示蚊群图像所述的类别;GT
k
(X
i
)代表第k类蚊群图像X
i
对应的真值图,k代表类别(k=1,2,...,8);P(X
i
)代表预测图;步骤2.4)联合训练生成器网络和判别器网络:在单独训练20次生成器网络后,对生成器网络和判别器网络进行联合训练;网络采用自适应矩估计作为优化器,其中参数学习率
为1e

5;总共训练180次;所述联合损失函数定义为公式(4):其中Loss
*
代表联合训练损失函数;表示为公式(5);表示为公式(6);(6);其中代表期望值;X
i
代表输入的图像;GT(X
i
)代表真值图;P(X
i
)代表预测图;D(X
i
,GT(X
i
))代表判别器将真值图判定为真的概率;1

D(X
i
,G(X
i
,P(X
i
)))代表判别器将生成器生成的预测图判定为假的概率;代表L1正则项用来约束真值图像与生成器生成图像之间的差异。4.如权利要求3所述基于生成对抗网络的蚊群计数方法,其特征是:步骤3)测试阶段具体是:将测试集图像输入训练阶段训练完成的生成器网络中得到预测图,所述预测图中蚊群总数Y的定义为公式(7):其中L和W代表图像的长和宽,p
l,w
代表预测图中位于(l,w)处的像素值,(L,W)的取值为(...

【专利技术属性】
技术研发人员:任俊豪陈华华侯娟孙文胜缪梓萍
申请(专利权)人:浙江省疾病预防控制中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1