当前位置: 首页 > 专利查询>蚌埠学院专利>正文

多区域深度特征融合的病鸡视觉识别模型构建及应用方法技术

技术编号:29586718 阅读:36 留言:0更新日期:2021-08-06 19:46
本发明专利技术提供多区域深度特征融合的病鸡视觉识别模型构建及应用方法,该方法包括:获取笼养鸡场景下的鸡只图片,根据鸡只图片,对鸡只的整鸡、鸡头、鸡身3个区域进行标注,以及健康鸡和病鸡两个类别标注,构建病鸡识别数据集;构建2阶段病鸡识别模型,该模型包括多区域定位模型和识别模型;利用公开数据集对多区域定位模型和识别模型进行预训练,再利用病鸡识别数据集,对模型进行微调,得到最终病鸡识别模型。本发明专利技术,从数据集制作策略,模型设计,训练策略等角度,尽可能解决笼养鸡场景病鸡识别中的复杂背景、严重遮挡、和多姿态问题,大大提高了病鸡的识别率,可以在养鸡场进行应用部署。

【技术实现步骤摘要】
多区域深度特征融合的病鸡视觉识别模型构建及应用方法
本专利技术涉及计算机视觉、家禽病患识别和机器学习等
,具体为一种多区域深度特征融合的病鸡视觉识别模型构建及应用方法。
技术介绍
近年来,家禽养殖产业在人工智能和5G技术的推动下,提出了精准饲喂、多模态监控、养殖业大数据等智慧养殖的概念。由于笼养环境的群体效应,会导致疾病在鸡群中迅速传播,利用计算机视觉技术实现病鸡的实时识别和鸡情监控,对提高养殖业自动化水平,实现智慧养殖具有重要意义。基于深度学习的计算机视觉在农业领域的植物表型研究、家禽家畜分类与行为识别领域应用研究成为近年来的研究热点。视觉技术在养鸡产业的应用也取得了积极成果。在传统视觉领域,CedricOkinda等提出病鸡早期的分类,利用二维姿态形状描述子和运动特征提取特征变量再用支持向量机进行分类。张铁民等提出根据音频特征和模糊神经网络的禽流感病鸡检测方法。毕敏娜等提出通过颜色分量分割鸡头各个区域,提取视觉特征并进行病鸡识别的方法。深度学习在病鸡识别领域的研究较少,易诗等提出基于改进的Tiny-YOLOV3轻量级目标检测模型进行野鸡的识别和监控。Zhang等提出基于残差网络结合特征金字塔的家禽疾病监控模型。上述研究利用现有视觉检测和分类模型在家禽家畜的定位和识别领域做了大量积极的研究。但在背景复杂、遮挡严重的多目标笼养鸡场景下,难以取得较好的效果,本方法采用基于深度学习的细粒度图像分类技术,通过区域定位和病鸡识别两阶段网络,通过数据集制作和模型创新,进行病鸡的识别。专利技术内容本专利技术的目的在于提供一种多区域深度特征融合的病鸡视觉识别模型构建及应用方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种多区域深度特征融合的病鸡视觉识别模型构建方法,该方法包括:S101、获取笼养鸡场景下的鸡只图片,根据鸡只图片,对鸡只的整鸡、鸡头、鸡身3个区域进行标注,以及健康鸡和病鸡两个类别标注,构建病鸡识别数据集;S102、构建2阶段病鸡识别模型,该模型包括多区域定位模型和识别模型;S103、利用公开数据集对多区域定位模型和识别模型进行预训练,再利用病鸡识别数据集,对模型进行微调,得到最终病鸡识别模型。优选的,健康鸡和病鸡两个类别标注采用预先分类标注,每个区域两个标签,一个是区域位置标签包括整鸡、鸡头和鸡身,一个是类别标签包括健康鸡和病鸡标签,标注方法采用:对某一区域露出部分超过50%且有明显特征,需要进行标注;露出部分不足50%,或者虽然超过50%但无明显特征,则不需要标注;如露出的鸡头包含了鸡喙和鸡冠,则用最小矩形框框选未被覆盖部分;部分身体被遮挡的目标只标注了鸡头区域,整鸡和鸡身不标注。优选的,所述多区域定位模型采用FasterR-CNN模型,进行鸡只的目标区域定位,该鸡只的目标区域定位包括:进行前景和背景目标识别和定位框的边框回归,再进行区域识别和进一步的区域边框回归,用兴趣区域对齐代替FasterR-CNN模型的兴趣区域池化,在基线模型中嵌入特征金字塔网络,融合高低分辨率特征,在基线模型中嵌入可变形卷积网络,通过在基线的C3-C5层采用了可变形卷积。优选的,所述识别模型包括区域抽取、特征提取以及融合分类,其中:区域抽取为根据多区域定位模型定位的3个区域,采用边框约束和几何约束的方法,提取区域并对区域进行修正,获取同一只鸡的3个区域的精确定位;特征提取为利用3个Resnet50-vd-Dcn卷积网络对3个区域分别进行特征提取;融合分类为级联3个区域特征向量形成6164维的特征向量,通过两级全连接网络进行二分类。优选的,精确定位后将定位出的3个区域图像等比例缩放,使得图像最短边缩放到256像素,然后从图像中间剪切出一个224*224像素大小,输入到Resnet50-vd-Dcn卷积网络进行特征提取;特征提取经过49层卷积后,进行全局均值池化和向量化后得到2048维的特征向量。优选的,两级全连接网络为FC1(1000)+FC(2)+Softmax,FC1网络输出1000维是为了保持与ImageNet预训练模型结构一致,网络输出层选择Softmax函数。优选的,所述公开数据集包括ImageNet-1k分类数据集以及COCO定位数据集,预训练包括分类模型和区域定位模型,其中分类模型采用Resnet50-vd-Dcn在ImageNet-1k数据集上的预训练模型,区域定位的基线模型ResNet50-vd-FPN-Dcn,采用在ImageNet-1k数据集上的预训练模型,区域定位模型FasterRCNN采用在COCO数据集上的预训练模型;利用病鸡识别数据集,对模型进行微调包括:数据集划分:按照数据集的70%、15%、15%比例划分为训练集、验证集和测试集;优化器参数设置:模型训练优化器使用在工业界广泛使用的带动量的小批量随机梯度下降法,设置批样本量为16,动量因子为0.9,初始学习率为1×10-4;采用学习率热身:在前5个epoch的m个Batches次迭代训练中,让学习率从零线性增加到初始学习率,最随后的训练中采用余弦退火的方式降低学习率;训练中的数据增强:在图像增强中采用了随机水平翻转、随机平移、随机光照和饱和度、随机裁剪和擦除数据增强方法,解决养鸡场场景中背景光照变化、目标位姿变化和相互遮挡问题;分阶段交替训练:加载COCO数据集预训练模型,利用病鸡识别数据集对预训练模型进行微调,采用分阶段交替训练的方法,在训练中交替执行评估,分类模型采用Resnet50-vd-Dcn在ImageNet-1k数据集上的预训练模型,选择特征级联融合方法,最后进行Softmax分类;训练参数设置:识别模型训练使用小批量带动量随机梯度下降法作为优化器,交叉熵作为损失函数,设动量因子设为0.9,初始学习率设为1×10-4,在前5个epoch的m个Batches次迭代训练中进行学习率热身,后期训练中采用余弦退火方式降低学习率;模型训练和保保存:训练中,在每一个Epoch进行训练集验证,并对模型参数进行保存,当训练集在多个Epoch的准确率比验证集高时,说明模型已经过拟合,即停止训练,以验证准确率最高的模型作为分类模型,训练完成后,保存模型结构和参数,即为最终病鸡识别模型。为实现上述目的,本专利技术还提供如下技术方案:一种多区域深度特征融合的病鸡视觉识别模型应用方法,采用如上述任意一项所述的最终病鸡识别模型进行识别,包括:获取笼养鸡场景下的鸡只图片;获取同一只鸡的整鸡、鸡头、鸡身3个图像块;通过分别提取3个区域的深度特征,融合3个区域的特征向量,并进行病鸡和健康鸡的分类。为实现上述目的,本专利技术还提供如下技术方案:一种多区域深度特征融合的病鸡视觉识别模型应用装置,包括:采集单元110,用于获取笼养鸡场景下的鸡只图片;定位单元111,用于获取同一只鸡的整鸡、鸡头、鸡身3个图像块;以及识别单元112本文档来自技高网
...

【技术保护点】
1.一种多区域深度特征融合的病鸡视觉识别模型构建方法,其特征在于,该方法包括:/n获取笼养鸡场景下的鸡只图片,根据鸡只图片,对鸡只的整鸡、鸡头、鸡身3个区域进行标注,以及健康鸡和病鸡两个类别标注,构建病鸡识别数据集;/n构建2阶段病鸡识别模型,该模型包括多区域定位模型和识别模型;/n利用公开数据集对多区域定位模型和识别模型进行预训练,再利用病鸡识别数据集,对模型进行微调,得到最终病鸡识别模型。/n

【技术特征摘要】
1.一种多区域深度特征融合的病鸡视觉识别模型构建方法,其特征在于,该方法包括:
获取笼养鸡场景下的鸡只图片,根据鸡只图片,对鸡只的整鸡、鸡头、鸡身3个区域进行标注,以及健康鸡和病鸡两个类别标注,构建病鸡识别数据集;
构建2阶段病鸡识别模型,该模型包括多区域定位模型和识别模型;
利用公开数据集对多区域定位模型和识别模型进行预训练,再利用病鸡识别数据集,对模型进行微调,得到最终病鸡识别模型。


2.根据权利要求1所述的一种多区域深度特征融合的病鸡视觉识别模型构建方法,其特征在于,健康鸡和病鸡两个类别标注采用预先分类标注,每个区域两个标签,一个是区域位置标签,一个是类别标签,标注方法采用:对某一区域露出部分超过50%且有明显特征,需要进行标注;露出部分不足50%,或者虽然超过50%但无明显特征,则不需要标注;如露出的鸡头包含了鸡喙和鸡冠,则用最小矩形框框选未被覆盖部分;部分身体被遮挡的目标只标注了鸡头区域,整鸡和鸡身不标注。


3.根据权利要求1所述的一种多区域深度特征融合的病鸡视觉识别模型构建方法,其特征在于,所述多区域定位模型采用FasterR-CNN模型,进行鸡只的目标区域定位,该鸡只的目标区域定位包括:进行前景和背景目标识别和定位框的边框回归,再进行区域识别和进一步的区域边框回归,用兴趣区域对齐代替FasterR-CNN模型的兴趣区域池化,在基线模型中嵌入特征金字塔网络,融合高低分辨率特征,在基线模型中嵌入可变形卷积网络,通过在基线的C3-C5层采用了可变形卷积。


4.根据权利要求1所述的一种多区域深度特征融合的病鸡视觉识别模型构建方法,其特征在于,所述识别模型包括区域抽取、特征提取以及融合分类,其中:区域抽取为根据多区域定位模型定位的3个区域,采用边框约束和几何约束的方法,提取区域并对区域进行修正,获取同一只鸡的3个区域的精确定位;特征提取为利用3个Resnet50-vd-Dcn卷积网络对3个区域分别进行特征提取;融合分类为级联3个区域特征向量形成6164维的特征向量,通过两级全连接网络进行二分类。


5.根据权利要求4所述的一种多区域深度特征融合的病鸡视觉识别模型构建方法,其特征在于,精确定位后将定位出的3个区域图像等比例缩放,使得图像最短边缩放到256像素,然后从图像中间剪切出一个224*224像素大小,输入到Resnet50-vd-Dcn卷积网络进行特征提取;特征提取经过49层卷积后,经过全局均值池化和向量化后得到2048维的特征向量。


6.根据权利要求4所述的一种多区域深度特征融合的病鸡视觉识别模型构建方法,其特征在于,两级全连接网络为FC1(1000)+FC(2)+Softmax,FC1网络输出1000维是为了保持与ImageNet预训练模型结构一致,网络输出层选择Softmax函数。


7.根据权利要...

【专利技术属性】
技术研发人员:陈章宝侯勇
申请(专利权)人:蚌埠学院
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1