一种基于深度学习的鸟类识别方法技术

技术编号:18895487 阅读:356 留言:0更新日期:2018-09-08 11:25
本发明专利技术公布了一种基于深度学习的鸟类识别方法,建立两个阶段的训练框架,在第一阶段,利用在大规模公开数据集上训练好的深度网络训练CUB‑200‑2011鸟类数据集,获得对鸟类数据集的微调模型;第二阶段,在自建的红树林滨海湿地数据集上微调第一阶段的模型,获得对于红树林滨海湿地特定鸟类的分类模型,利用分类模型实现基于深度学习的鸟类识别。本发明专利技术能够实现基于深度学习的鸟类识别,解决现有采用机器学习方法对鸟类图像进行分类和识别中速度较慢、准确率过低的问题。

A bird recognition method based on deep learning

The invention discloses a bird recognition method based on depth learning, and establishes a two-stage training framework. In the first stage, the bird data set of CUB_200_2011 is trained by the depth network trained on a large-scale open data set, and the fine-tuning model of the bird data set is obtained; in the second stage, the mangrove tree is built by itself. The first stage model is fine-tuned on the coastal wetland data set to obtain the classification model for specific birds in mangrove coastal wetland. The classification model is used to realize bird recognition based on depth learning. The invention can realize bird recognition based on depth learning, and solve the problems of slow speed and low accuracy in classifying and recognizing bird images by using machine learning method.

【技术实现步骤摘要】
一种基于深度学习的鸟类识别方法
本专利技术属于机器学习、鸟类识别
,涉及基于图像分类的鸟类识别技术,具体涉及一种基于深度学习算法的鸟类识别方法。
技术介绍
近几年随着深度学习的发展,利用深度学习算法在特定数据集(如ImageNet、CUB-200-2011)上进行图像分类的准确率不断提高,图像分类已从科研领域上升到具体的实际应用,具体包括图像识别、图像检索(以图搜图)等等。在图像分类领域中,自然场景下的图像是构成数据库的主要来源,而鸟类识别是其中一个非常重要的应用场景。鸟类识别本质是鸟类图像的分类。目前,鸟类分类的现有技术按照标记数据的多少可以分为强监督学习与弱监督学习方法。强监督学习是一种基于位置定位的模型,在训练时标注好部件的位置;虽然这种方法对部件姿态、光照的变化有很好的鲁棒性,但是额外标记数据需要大量的人力成本。弱监督学习方法通常采用常用的纹理表征方法(texturerepresentation),如传统的SIFT特征,以及近期流行的卷积神经网络ConvolutionalNeuralNetwork,如:文献(HeK,ZhangX,RenS,etal.DeepResidualLearningforImageRecognition[J].2015:770-778.)记载的深度残差网络DeepResidualNetwork;弱监督学习往往是对图像一次性提取整体的特征表示,方法优势在于仅需标记类别标签,方便端到端训练、且有在ImageNet数据集上训练好的模型进行fine-tune操作;该方法的缺点在于每次处理对象仅仅是整个图像、对于区别鸟类的关键细节特征缺乏关注,因此需要更多的数据,才能更好地提取图像的特征,而鸟类图片的采集往往非常困难,特别是一些稀有鸟的照片很少,难以通过大量的数据学习特征,这导致了弱监督学习分类效果的不足。
技术实现思路
本专利技术的目的是提供一种基于深度学习的鸟类识别方法,通过建立两个阶段的训练框架,获得对于红树林滨海湿地特定鸟类的分类模型,实现基于深度学习的鸟类识别,能够解决现有采用机器学习方法对鸟类图像进行分类和识别中速度较慢、准确率过低的问题。本专利技术的技术方案是:一种基于深度学习的鸟类识别方法,首先建立两个阶段的训练框架,在第一阶段,利用在大规模公开数据集(如数据集ImageNet)上训练好的深度网络训练CUB-200-2011鸟类数据集,获得对鸟类数据集的一个微调模型;第二阶段,在我们自建的红树林滨海湿地数据集上,微调上一阶段的模型,获得对于红树林滨海湿地特定鸟类的分类模型,包括如下步骤:A.收集红树林滨海湿地原始图片数据集,对数据集的原始图片做水平翻转处理,增加一倍的数据量,作为训练数据集:红树林鸟类数据库;B.以大规模公开数据库为基础预训练深度网络Net1,使得该神经网络可以对大规模公开数据库进行分类,公开数据库的规模越大越好,但是要求该数据库每一类的图片分类准确,同一个类别下的图片数量至少上百张,这样可以获得对于图像很好的特征提取能力;接着修改大规模公开数据库预训练的深度网络,具体是将最后一层分类层的类别数量从基于大规模公开数据库的类别总数改为基于CUB-200-2011鸟类数据库的类别总数,这个调整是适应该数据库的类别总数;然后,将倒数两层的全连接层参数数量也依次缩小,以适应小规模的数据库数据量不足,这是因为卷积神经网络提取的图像特征在分类前,需要对特征进行编码,若参数过多或过少、都会导致编码能力不足而影响最终分类结果,所以全连接层的参数需要根据数据库大小调至合适的值;然后,用修改后的神经网络训练CUB-200-2011鸟类数据集,得到深度网络Net2,为对鸟类数据集的微调模型;C.利用步骤A得到的数据集对步骤B得到的网络模型Net2进行训练,修改Net2最后一层分类层类别的数量等于步骤A得到的红树林鸟类数据库的类别数量(例如具体实施中数量改为10),因为具体实施中步骤A得到的红树林鸟类数据库的类别数量是10,获得针对步骤A得到的红树林鸟类数据库的训练好的网络模型Net3;D.将待识别的鸟类图片输入到C训练后的网络模型Net3,C训练后的网络模型对于输入图片,输出它的类别标签,这个类别标签就是每张图片所属的鸟类类别。与现有技术相比,本专利技术的有益效果是:本专利技术的目的是提供一种基于深度学习的鸟类识别方法,以解决现有采用机器学习方法对鸟类图像进行分类和识别的准确率过低的问题本专利技术所述的方法不仅具有较好的鲁棒性,而且可以针对不同的数据集、新增数据集开展很好的微调以扩展现有的深度网络模型。通过本专利技术所提供的深度学习方法,提高了在红树林湿地鸟类数据集上的识别准确率,加快了单张图像的识别速度,节省了科研人员对于辨别鸟类的时间,特别是对于专家级别的鸟分类。同时,本专利技术的测试算法时间复杂度低,对硬件要求水平低,易于实时运行在计算能力有限的环境中。附图说明图1是本专利技术实施例提供的基于深度学习的鸟类识别方法的流程框图。图2是本专利技术实施例中的红树林鸟类数据集的建立流程框图。具体实施方式下面结合附图,通过实施例进一步描述本专利技术,但不以任何方式限制本专利技术的范围。本专利技术提供一种基于深度学习的鸟类识别方法,针对不同的数据集、新增数据集,通过微调扩展原有网络模型,能够加快单张图像的鸟类识别速度,提高鸟类识别的准确率。图1是本专利技术实施例提供的基于深度学习的鸟类识别方法的流程框图,包括如下步骤:A.收集红树林滨海湿地图片数据集,对数据集图片做水平翻转处理,增加一倍的数据量,作为训练数据集;B.以ImageNet预训练的深度网络为基础、使得该神经网络可以对imagenet的1000类进行分类;修改ImageNet预训练的深度网络,将最后一层分类层的类别数量从基于imagenet数据库的1000类改为基于CUB200数据库的200类,将倒数第二、第三层的全连接层参数数量从4096,4096改为2048,1024以适应小规模的数据库;然后,用修改后的神经网络训练CUB-200-2011数据集(Caltech-UcsdBirds-200-2011Dataset加利福尼亚理工学院鸟类数据库);C.对步骤B得到的网络模型,在A的数据集上训练,获得针对步骤A得到的红树林鸟类数据库的网络模型:D.对于一个输入的待测试图片,利用C得到的网络,识别这张图片所属的类别。以下针对某滨海城市的红树林滨海湿地鸟类数据,通过实施例详细叙述本专利技术方法的具体实施步骤。1.红树林滨海湿地鸟类数据集建立深圳红树林自然保护区位于深圳湾北东岸深圳河口的红树林鸟类自然保护区,每年冬季都有大量候鸟前来过冬,是观察鸟类族群发展的最好自然平台。图2所示是本实施例中的红树林鸟类数据集的建立流程,数据集建立包括:现场拍摄图片、图像剪裁、人工图像分类等过程。该数据库为滨海湿地实地拍摄,并经过人工筛选,所有图片背景都是真实自然场景。在训练过程中,可通过对图片进行翻转等几何变换、增大训练数据量,防止训练过拟合。2.利用卷积神经网络训练CUB200-2011数据集我们使用在ImageNet公开数据库(http://www.image-net.org/)上预训练的卷积神经网络(CNN)模型,将最后一层分类层的类别数量从基于imagenet数据库的1000本文档来自技高网
...

【技术保护点】
1.一种基于深度学习的鸟类识别方法,建立两个阶段的训练框架,在第一阶段,利用在大规模公开数据集上训练好的深度网络训练CUB‑200‑2011鸟类数据集,获得对鸟类数据集的微调模型;第二阶段,在自建的红树林滨海湿地数据集上微调第一阶段的模型,获得对于红树林滨海湿地特定鸟类的分类模型,利用所述分类模型实现基于深度学习的鸟类识别;包括如下步骤:A.收集红树林滨海湿地原始图片数据集,对数据集的原始图片做水平翻转处理,增加一倍的数据量,得到红树林鸟类数据库,作为训练数据集;B.首先以大规模公开数据库为基础预训练深度网络Net1,使得该神经网络可以对大规模公开数据库进行分类;该大规模公开数据库中每一类的图片分类准确,同一个类别下的图片数量至少上百张,以利于对图像进行特征提取;接着修改大规模公开数据库预训练的深度网络,具体是:将深度网络最后一层分类层的类别数量从基于大规模公开数据库的类别总数改为基于CUB‑200‑2011鸟类数据库的类别总数;其次,将倒数两层的全连接层参数数量依次缩小,以适应小规模的数据库数据量;然后,用修改后的神经网络训练CUB‑200‑2011鸟类数据集,得到深度网络Net2,作为对鸟类数据集的微调模型;C.利用步骤A得到的训练数据集对步骤B得到的微调网络模型Net2进行训练,修改Net2最后一层分类层类别的数量,获得针对步骤A得到的红树林鸟类数据库的训练好的网络模型Net3;D.将待识别的鸟类图片输入到步骤C训练后的网络模型Net3,步骤C训练后的网络模型对于输入图片,输出类别标签,所述类别标签即每张图片所属的鸟类类别。...

【技术特征摘要】
1.一种基于深度学习的鸟类识别方法,建立两个阶段的训练框架,在第一阶段,利用在大规模公开数据集上训练好的深度网络训练CUB-200-2011鸟类数据集,获得对鸟类数据集的微调模型;第二阶段,在自建的红树林滨海湿地数据集上微调第一阶段的模型,获得对于红树林滨海湿地特定鸟类的分类模型,利用所述分类模型实现基于深度学习的鸟类识别;包括如下步骤:A.收集红树林滨海湿地原始图片数据集,对数据集的原始图片做水平翻转处理,增加一倍的数据量,得到红树林鸟类数据库,作为训练数据集;B.首先以大规模公开数据库为基础预训练深度网络Net1,使得该神经网络可以对大规模公开数据库进行分类;该大规模公开数据库中每一类的图片分类准确,同一个类别下的图片数量至少上百张,以利于对图像进行特征提取;接着修改大规模公开数据库预训练的深度网络,具体是:将深度网络最后一层分类层的类别数量从基于大规模公开数据库的类别总数改为基于CUB-200-2011鸟类数据库的类别总数;其次,将倒数两层的全连接层参数数量依次缩小,以适应小规模的数据库数据量;然后,用修改后的神经网络训练CUB-200-2011鸟类数据集...

【专利技术属性】
技术研发人员:邹月娴陆超豪
申请(专利权)人:北京大学深圳研究生院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1