一种鸟类识别方法、系统、存储介质及计算设备技术方案

技术编号:39143684 阅读:14 留言:0更新日期:2023-10-23 14:55
本发明专利技术公开了一种鸟类识别方法、系统、存储介质及计算设备,本发明专利技术采用MobileNet模型和卷积注意力模块构建鸟类识别模型,有效增强了识别精度,可将鸟类识别模型转换、量化压缩到移动终端,不仅降低了模型对硬件资源的需求,而且无需依赖网络,可在移动终端即可进行离线识别,适用于网络覆盖不完善的野外工作。适用于网络覆盖不完善的野外工作。适用于网络覆盖不完善的野外工作。

【技术实现步骤摘要】
一种鸟类识别方法、系统、存储介质及计算设备


[0001]本专利技术涉及一种鸟类识别方法、系统、存储介质及计算设备,属于计算机视觉


技术介绍

[0002]鸟类图像识别属于细粒度图像识别任务,在大多细粒度图像识别研究中,鸟类图像识别问题因为鸟类类间差别小、类内差别大而导致其成为最复杂的细粒度图像识别问题之一。为了提高识别的精度和识别效果,目前鸟类识别采用更深、更复杂的神经网络模型来实现,并且模型工作在客户端

服务端模式,不仅对网络情况要求较高,而且对硬件资源要求较高,不能适用于网络覆盖不完善的野外工作。

技术实现思路

[0003]本专利技术提供了一种鸟类识别方法、系统、存储介质及计算设备,解决了
技术介绍
中披露的问题。
[0004]为了解决上述技术问题,本专利技术所采用的技术方案是:一种鸟类识别方法,所述鸟类识别方法实施在移动终端,包括:采集待识别的鸟类图像;将待识别的鸟类图像输入量化压缩后的鸟类识别模型,获得鸟类识别结果;其中,量化压缩鸟类识别模型过程为:采用轻量级深度学习框架对训练完成的鸟类识别模型进行转换,采用半精度量化模型对转换后的鸟类识别模型进行量化压缩;鸟类识别模型包括MobileNet模型以及与MobileNet模型串行连接的卷积注意力模块。
[0005]MobileNet模型为在现有MobileNet模型的基础上改进的模型,改进处为:在现有MobileNet模型的基础上,将最上层的全连接层替换为输入层和数据变换层,输入层用以按照预定大小接收输入的鸟类图像,数据变换层用以开始对输入的鸟类图像进行特征提取。
[0006]在训练鸟类识别模型时,冻结除输入层和数据变换层外其它层的权值,先训练输入层和数据变换层,在输入层和数据变换层获得初始权重后,训练所有层。
[0007]卷积注意力模块包括通道注意力模块和空间注意力模块,MobileNet模型依次串行连接通道注意力模块和空间注意力模块;通道注意力模块根据输入鸟类图像的特征通道,将空间维度进行特征压缩,为每个特征通道生成权重,使鸟类识别模型学习到不同特征通道的重要性;空间注意力模块根据分类任务主体,使鸟类识别模型学习鸟类图像中特征明显的部分。
[0008]一种鸟类识别系统,所述鸟类识别系统装载在移动终端,包括:采集模块,采集待识别的鸟类图像;识别模块,将待识别的鸟类图像输入量化压缩后的鸟类识别模型,获得鸟类识别结果;其中,量化压缩鸟类识别模型过程为:采用轻量级深度学习框架对训练完成的鸟类识别模型进行转换,采用半精度量化模型对转换后的鸟类识别模型进行量化压缩;鸟类识别
模型包括MobileNet模型以及与MobileNet模型串行连接的卷积注意力模块。
[0009]识别模块中,MobileNet模型为在现有MobileNet模型的基础上改进的模型,改进处为:在现有MobileNet模型的基础上,将最上层的全连接层替换为输入层和数据变换层,输入层用以按照预定大小接收输入的鸟类图像,数据变换层用以开始对输入的鸟类图像进行特征提取。
[0010]在训练鸟类识别模型时,冻结除输入层和数据变换层外其它层的权值,先训练输入层和数据变换层,在输入层和数据变换层获得初始权重后,训练所有层。
[0011]卷积注意力模块包括通道注意力模块和空间注意力模块,MobileNet模型依次串行连接通道注意力模块和空间注意力模块;通道注意力模块根据输入鸟类图像的特征通道,将空间维度进行特征压缩,为每个特征通道生成权重,使鸟类识别模型学习到不同特征通道的重要性;空间注意力模块根据分类任务主体,使鸟类识别模型学习鸟类图像中特征明显的部分。
[0012]一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行鸟类识别方法。
[0013]一种计算设备,包括一个或多个处理器、一个或多个存储器以及一个或多个程序,其中一个或多个程序存储在所述一个或多个存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行鸟类识别方法的指令。
[0014]本专利技术所达到的有益效果:本专利技术采用MobileNet模型和卷积注意力模块构建鸟类识别模型,有效增强了识别精度,可将鸟类识别模型转换、量化压缩到移动终端,不仅降低了模型对硬件资源的需求,而且无需依赖网络,可在移动终端即可进行离线识别,适用于网络覆盖不完善的野外工作。
附图说明
[0015]图1为鸟类识别方法的流程图;图2为鸟类识别模型的示意图;图3为通道识别模块的示意图;图4为空间识别模块的示意图。
实施方式
[0016]下面结合附图对本专利技术作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。
[0017]如图1所示,一种鸟类识别方法,该方法实施在移动终端,具体过程包括:步骤1,采集待识别的鸟类图像。
[0018]步骤2,将待识别的鸟类图像输入量化压缩后的鸟类识别模型,获得鸟类识别结果;其中,量化压缩鸟类识别模型过程为:采用面向移动端和嵌入式的轻量级深度学习框架(TensorFlow Lite)对训练完成的鸟类识别模型进行转换;采用半精度量化模型对转换后的鸟类识别模型进行量化压缩,具体是将模型的权重和激活值转换为float16数据类型,并将它们存储在相应的量化参数中,在推理时,将输入数据转换为float16数据类型,并在模型中进行前向计算,在输出时,将模型的输出结果转换为float32数据类型,以保证输出的
精度;鸟类识别模型包括MobileNet模型以及与MobileNet模型串行连接的卷积注意力模块。
[0019]上述方法采用MobileNet模型和卷积注意力模块构建鸟类识别模型,有效增强了识别精度,可将鸟类识别模型转换、量化压缩到移动终端,不仅降低了模型对硬件资源的需求,而且无需依赖网络,可在移动终端即可进行离线识别,适用于网络覆盖不完善的野外工作。
[0020]在实施上述方法之前,需要先构建和训练鸟类识别模型,由于要在移动终端实施,不能消耗过多的硬件资源,因此鸟类识别模型的主体采用MobileNet模型,MobileNet模型是针对手机等嵌入式设备的一种轻量级的深层神经网络,核心思想是深度可分离卷积。
[0021]为了适应终端拍摄的图像,需要在现有MobileNet模型的基础上改进,具体改进为在现有MobileNet模型的基础上,将最上层的全连接层替换为输入层和数据变换层,输入层用以按照预定大小接收输入的鸟类图像,数据变换层用以开始对输入的鸟类图像进行特征提取,在硬件资源十分有限的条件下,这样做更有利于MobileNet模型进行特征提取。通过自定义的输入层和数据变换层,有助于后续MobileNet模型学习到图像的非线性特征;其中,改进后的MobileNet模型的片段如表1。
[0022][0023]为了增强识别精度,在改进的MobileNet模型后串行连接卷积注意本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种鸟类识别方法,其特征在于,所述鸟类识别方法实施在移动终端,包括:采集待识别的鸟类图像;将待识别的鸟类图像输入量化压缩后的鸟类识别模型,获得鸟类识别结果;其中,量化压缩鸟类识别模型过程为:采用轻量级深度学习框架对训练完成的鸟类识别模型进行转换,采用半精度量化模型对转换后的鸟类识别模型进行量化压缩;鸟类识别模型包括MobileNet模型以及与MobileNet模型串行连接的卷积注意力模块。2.根据权利要求1所述的鸟类识别方法,其特征在于,MobileNet模型为在现有MobileNet模型的基础上改进的模型,改进处为:在现有MobileNet模型的基础上,将最上层的全连接层替换为输入层和数据变换层,输入层用以按照预定大小接收输入的鸟类图像,数据变换层用以开始对输入的鸟类图像进行特征提取。3.根据权利要求2所述的鸟类识别方法,其特征在于,在训练鸟类识别模型时,冻结除输入层和数据变换层外其它层的权值,先训练输入层和数据变换层,在输入层和数据变换层获得初始权重后,训练所有层。4.根据权利要求1所述的鸟类识别方法,其特征在于,卷积注意力模块包括通道注意力模块和空间注意力模块,MobileNet模型依次串行连接通道注意力模块和空间注意力模块;通道注意力模块根据输入鸟类图像的特征通道,将空间维度进行特征压缩,为每个特征通道生成权重,使鸟类识别模型学习到不同特征通道的重要性;空间注意力模块根据分类任务主体,使鸟类识别模型学习鸟类图像中特征明显的部分。5.一种鸟类识别系统,其特征在于,所述鸟类识别系统装载在移动终端,包括:采集模块,采集待识别的鸟类图像;识别模块,将待识别的鸟类图像输入量化压缩后的鸟类识别模型,获得鸟类识别结果;其中,量化压缩鸟类识别模型过程为:采用轻量级深度学习框架对训练完成...

【专利技术属性】
技术研发人员:余文斌孙锐张成军姚宇张艺凡陈宇浩陈宗远薛圣炜
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1