一种基于深度学习网络的轻量化的高分辨率鸟群识别方法技术

技术编号:33292469 阅读:20 留言:0更新日期:2022-05-01 00:14
本发明专利技术提供了一种基于深度学习网络的轻量化的高分辨率鸟群识别方法,包括:基于HRNet网络构建有四个并行子网组成的鸟群场景识别网络;基于点级注释和聚焦逆距离算法生成FIDT图,通过所述FIDT图对所述鸟群场景识别网络进行监督训练;将机场鸟群图片集导入所述监督训练后的鸟群场景识别网络,通过联合上采样,获取最终特征图集合;根据所述最终特征图集合,基于预设的计数准则和定位准则,确定鸟群的唯一计数定位图。本文发明专利技术通过非对称卷积与冗余特征图线性变换机制相结合,增强了网络提取鸟群飞行姿态特征的能力和获得丰富的鸟群特征的同时,降低了模型复杂度。本发明专利技术通过联合损失函数来监督训练过程,减少图像中无关背景的影响,加快网络收敛速度。加快网络收敛速度。加快网络收敛速度。

【技术实现步骤摘要】
一种基于深度学习网络的轻量化的高分辨率鸟群识别方法


[0001]本专利技术涉及机场鸟类识别
,特别涉及一种基于深度学习网络的轻量化的高分辨率鸟群识别方法。

技术介绍

[0002]随着航空业的快速发展和空中航线的不断增多,飞行器和鸟类对空域的争夺愈发激烈,其起飞和降落环境的安全性受到高度重视。尤其是在沿海地区,机场周边分布有大面积的滩涂湿地,吸引了大量湿地鸟类在湿地和浅水生态集群觅食,致使临海机场同时受到陆地鸟和水鸟的双重影响,造成严重的鸟击风险。目前机场中主流的飞鸟检测手段包括雷达法、热成像法和图像处理等技术。其中,雷达法是通过使用探鸟雷达对飞行的鸟类进行探测,获取目标的经纬度信息,计算出目标的飞行速度和方向,热成像法主要是在夜间将鸟类发出的不可见红外能量转变为可见的热图像进行检测。然而这两种方法需要专业检测设备,性价比较低,获得的鸟类信息有限,相比之下,图像处理技术则相对廉价,只需通过摄像头将图像信息传入处理器进行处理即可,并且可以向地面工作人员提供机场中鸟类的数量、位置和个体大小等信息,提高驱鸟工作效率。这项鸟群场景识别视觉任务主要包括鸟群计数和定位两个子任务,鸟群计数的目的是估算图像或视频中出现鸟类的数量,鸟群定位是在鸟群计数的同时识别场景中每个实例的位置和尺度大小,这对于改善现有驱鸟模式,提高驱鸟工作效果具有重要的实用价值。此外,性能良好的鸟群计数和定位算法可以应用到其他视觉领域,如公共安全、交通管理、环境保护、农业监控和医学细胞计数等,具有重要的现实意义和应用价值。
[0003]对鸟群图像或视频进行推理是一项具有挑战的计算机视觉任务,对模型的效率和准确率都有较高要求。现有技术中,鸟群图像的计数和定位任务主要面临以下四个困难:
[0004](1)鸟群场景中存在严重的遮挡,形态变化多样,受光照和色彩变化影响严重,不利于鸟群区域的识别;
[0005](2)由于摄像设备距离鸟群目标距离不同,导致同一目标在不同图像之间存在较大的尺度变化;
[0006](3)非均匀的鸟群分布,图像中正样本(鸟类)和负样本(背景)分布不均衡,给训练过程带来了巨大挑战。
[0007](4)目前公开的鸟类数据集大多侧重于鸟类分类,每张图片中通常包含少量鸟类,并且拍摄距离较近,无法应用于鸟群计数和定位的研究。

技术实现思路

[0008]本专利技术提供一种基于深度学习网络的轻量化的高分辨率鸟群识别方法,用以解决鸟群场景中存在严重的遮挡,形态变化多样,受光照和色彩变化影响严重,不利于鸟群区域的识别;由于摄像设备距离鸟群目标距离不同,导致同一目标在不同图像之间存在较大的尺度变化;非均匀的鸟群分布,图像中正样本(鸟类)和负样本(背景)分布不均衡,给训练过
程带来了巨大挑战。目前公开的鸟类数据集大多侧重于鸟类分类,每张图片中通常包含少量鸟类,并且拍摄距离较近,无法应用于鸟群计数和定位的研究的情况。
[0009]一种基于深度学习网络的轻量化的高分辨率鸟群识别方法,包括:
[0010]基于HRNet网络构建有四个并行子网组成的鸟群场景识别网络;
[0011]基于点级注释和聚焦逆距离算法生成FIDT图,通过所述FIDT图对所述鸟群场景识别网络进行监督训练;
[0012]将机场鸟群图片集导入所述监督训练后的鸟群场景识别网络,通过联合上采样,获取最终特征图集合;
[0013]根据所述最终特征图集合,基于预设的计数准则和定位准则,确定鸟群的唯一计数定位图。
[0014]作为本专利技术的一种实施例:所述并行子网包括第一子网、第二子网、第三子网和第四子网;其中,
[0015]所述第四子网的分辨率为第三子网分辨率的一半;
[0016]所述第三子网的分辨率为第二子网分辨率的一半;
[0017]所述第二子网的分辨率为第一子网分辨率的一半;
[0018]所述并行子网的分辨率依次减半降低;其中,
[0019]所述子网得分辨率在减半降低时,所述子网的通道数翻倍;
[0020]所述四个并行子网用于生成四个不同尺寸的特征图。
[0021]作为本专利技术的一种实施例:所述方法还包括:
[0022]基于非对称卷积和冗余特征图线性变换机制,构建鸟群场景识别网络的残差模块;其中,
[0023]所述残差模块包括多个ACGblock模块和多个ACGneck模块;
[0024]所述第一子网由4个ACGneck模块构成;
[0025]所述第二子网由一个多分辨率块构成;
[0026]所述第三子网由四个多分辨率块构成;
[0027]所述第四子网由三个多分辨率块构成;
[0028]所述多分辨率块由四个ACGblock模块构成。
[0029]作为本专利技术的一种实施例:所述冗余特征图线性变换机制包括:
[0030]基于所述普通卷积层通过的卷积核生成部分原始特征图;
[0031]通过所述特征通道卷积层,将所述部分原始特征图进行线性变换,生成通道特征图。
[0032]作为本专利技术的一种实施例:所述方法还包括:
[0033]对所述四个不同尺寸的特征图进行插值上采样,其包括如下步骤:
[0034]将所述四个不同尺寸的特征图调整为相同的通道数进行输出;
[0035]并将所述特征图内的鸟群特征映射至相同的空间,确定机场鸟群图片集在四个不同尺寸下的多尺度信息。
[0036]作为本专利技术的一种实施例:所述基于点级注释和聚焦逆距离算法生成FIDT图包括:
[0037]获取标注工具;
[0038]通过所述标注工具对预设训练数据集中每张图像进行点级标注;
[0039]根据所述点级标注,确定坐标位置和鸟群数量,并生成点级标注的标注训练数据集;
[0040]将所述标注训练数据集通过聚焦逆距离算法,进行聚焦变换,生成FIDT图。
[0041]作为本专利技术的一种实施例:所述基于点级注释和聚焦逆距离算法生成FIDT图还包括:
[0042]基于所述FIDT图,进行数据扩展;其中,
[0043]所述数据集扩展包括:图像缩放、图像剪切和图像旋转;
[0044]在数据扩展后,构建3*3的池化层;
[0045]根据所述3*3的池化层,确定FIDT图中鸟群位置信息;
[0046]根据所述FIDT图中鸟群位置信息,设置自适应阈值,判断所述点级注释是否漏报。
[0047]作为本专利技术的一种实施例:所述方法还包括:
[0048]根据所述最终特征图,建立基于负样本抑制损失函数与区域结构损失函数的联合损失函数;其中,
[0049]所述联合损失函数定义为:
[0050][0051]其中,为控制负样本抑制损失函数权重的超参数,L2为欧里几德损失,L
I

S
为区域结构损失函数,L
mf
为负样本抑制损失函数
[0052]所述负样本抑制损失函数定义为:
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习网络的轻量化的高分辨率鸟群识别方法,其特征在于,包括:基于HRNet网络构建有四个并行子网组成的鸟群场景识别网络;基于点级注释和聚焦逆距离算法生成FIDT图,通过所述FIDT图对所述鸟群场景识别网络进行监督训练;将机场鸟群图片集导入所述监督训练后的鸟群场景识别网络,通过联合上采样,获取最终特征图集合;根据所述最终特征图集合,基于预设的计数准则和定位准则,确定鸟群的唯一计数定位图。2.如权利要求1所述的一种基于深度学习网络的轻量化的高分辨率鸟群识别方法,其特征在于,所述并行子网包括第一子网、第二子网、第三子网和第四子网;其中,所述第四子网的分辨率为第三子网分辨率的一半;所述第三子网的分辨率为第二子网分辨率的一半;所述第二子网的分辨率为第一子网分辨率的一半;并行子网的分辨率依次减半降低;其中,所述子网得分辨率在减半降低时,所述子网的通道数翻倍;所述四个并行子网用于生成四个不同尺寸的特征图。3.如权利要求2所述的一种基于深度学习网络的轻量化的高分辨率鸟群识别方法,其特征在于,所述方法还包括:基于非对称卷积和冗余特征图线性变换机制,构建鸟群场景识别网络的残差模块;其中,所述并行子网包括多个ACGblock模块和多个ACGneck模块;所述第一子网由4个ACGneck模块构成;所述第二子网由一个多分辨率块构成;所述第三子网由四个多分辨率块构成;所述第四子网由三个多分辨率块构成;所述多分辨率块由四个ACGblock模块构成。4.如权利要求2所述的一种基于深度学习网络的轻量化的高分辨率鸟群识别方法,其特征在于,所述冗余特征图线性变换机制包括:基于普通卷积层的卷积核生成部分原始特征图;通过所述特征通道卷积层,将所述部分原始特征图进行线性变换,生成通道特征图。5.如权利要求1所述的一种基于深度学习网络的轻量化的高分辨率鸟群识别方法,其特征在于,所述方法还包括:对所述四个不同尺寸的特征图进行插值上采样,其包括如下步骤:将所述四个不同尺寸的特征图调整为相同的通道数进行输出;并将所述特征图内的鸟群特征映射至相同的空间,确定机场鸟群图片集在四个不同尺寸下的多尺度信息。6.如权利要求1所述的一种基于深度学习网络的轻量化的高分辨率鸟群识别方法,其特征在于,所述基于点级注释和聚焦逆距离算法生成FIDT图包括:获取标注工具;
通过所述标注工具对预设训练数据集中每张图像进行点级标注;根据所述点级标注,确定坐标位置和鸟群数量,并生成点级标注的标注训练数据集;将所述标注训练数据集通过聚焦逆距离算法,进行聚焦变换,生成...

【专利技术属性】
技术研发人员:孙辉史玉龙王蕊
申请(专利权)人:中国民航大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1