一种基于深度学习的鸟类识别方法技术

技术编号：18895487 阅读：356 留言：0更新日期：2018-09-08 11:25

本发明专利技术公布了一种基于深度学习的鸟类识别方法，建立两个阶段的训练框架，在第一阶段，利用在大规模公开数据集上训练好的深度网络训练CUB‑200‑2011鸟类数据集，获得对鸟类数据集的微调模型；第二阶段，在自建的红树林滨海湿地数据集上微调第一阶段的模型，获得对于红树林滨海湿地特定鸟类的分类模型，利用分类模型实现基于深度学习的鸟类识别。本发明专利技术能够实现基于深度学习的鸟类识别，解决现有采用机器学习方法对鸟类图像进行分类和识别中速度较慢、准确率过低的问题。

A bird recognition method based on deep learning

The invention discloses a bird recognition method based on depth learning, and establishes a two-stage training framework. In the first stage, the bird data set of CUB_200_2011 is trained by the depth network trained on a large-scale open data set, and the fine-tuning model of the bird data set is obtained; in the second stage, the mangrove tree is built by itself. The first stage model is fine-tuned on the coastal wetland data set to obtain the classification model for specific birds in mangrove coastal wetland. The classification model is used to realize bird recognition based on depth learning. The invention can realize bird recognition based on depth learning, and solve the problems of slow speed and low accuracy in classifying and recognizing bird images by using machine learning method.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的鸟类识别方法
本专利技术属于机器学习、鸟类识别
，涉及基于图像分类的鸟类识别技术，具体涉及一种基于深度学习算法的鸟类识别方法。
技术介绍
近几年随着深度学习的发展，利用深度学习算法在特定数据集(如ImageNet、CUB-200-2011)上进行图像分类的准确率不断提高，图像分类已从科研领域上升到具体的实际应用，具体包括图像识别、图像检索(以图搜图)等等。在图像分类领域中，自然场景下的图像是构成数据库的主要来源，而鸟类识别是其中一个非常重要的应用场景。鸟类识别本质是鸟类图像的分类。目前，鸟类分类的现有技术按照标记数据的多少可以分为强监督学习与弱监督学习方法。强监督学习是一种基于位置定位的模型，在训练时标注好部件的位置；虽然这种方法对部件姿态、光照的变化有很好的鲁棒性，但是额外标记数据需要大量的人力成本。弱监督学习方法通常采用常用的纹理表征方法(texturerepresentation)，如传统的SIFT特征，以及近期流行的卷积神经网络ConvolutionalNeuralNetwork，如：文献(HeK,ZhangX,RenS,etal.DeepResidualLearningforImageRecognition[J].2015:770-778.)记载的深度残差网络DeepResidualNetwork；弱监督学习往往是对图像一次性提取整体的特征表示，方法优势在于仅需标记类别标签，方便端到端训练、且有在ImageNet数据集上训练好的模型进行fine-tune操作；该方法的缺点在于每次处理对象仅仅是整个图像、对于区别鸟类的关键细...

【技术保护点】
1.一种基于深度学习的鸟类识别方法，建立两个阶段的训练框架，在第一阶段，利用在大规模公开数据集上训练好的深度网络训练CUB‑200‑2011鸟类数据集，获得对鸟类数据集的微调模型；第二阶段，在自建的红树林滨海湿地数据集上微调第一阶段的模型，获得对于红树林滨海湿地特定鸟类的分类模型，利用所述分类模型实现基于深度学习的鸟类识别；包括如下步骤：A.收集红树林滨海湿地原始图片数据集，对数据集的原始图片做水平翻转处理，增加一倍的数据量，得到红树林鸟类数据库，作为训练数据集；B.首先以大规模公开数据库为基础预训练深度网络Net1，使得该神经网络可以对大规模公开数据库进行分类；该大规模公开数据库中每一类的图片分类准确，同一个类别下的图片数量至少上百张，以利于对图像进行特征提取；接着修改大规模公开数据库预训练的深度网络，具体是：将深度网络最后一层分类层的类别数量从基于大规模公开数据库的类别总数改为基于CUB‑200‑2011鸟类数据库的类别总数；其次，将倒数两层的全连接层参数数量依次缩小，以适应小规模的数据库数据量；然后，用修改后的神经网络训练CUB‑200‑2011鸟类数据集，得到深度网络Net2，...

【技术特征摘要】
1.一种基于深度学习的鸟类识别方法，建立两个阶段的训练框架，在第一阶段，利用在大规模公开数据集上训练好的深度网络训练CUB-200-2011鸟类数据集，获得对鸟类数据集的微调模型；第二阶段，在自建的红树林滨海湿地数据集上微调第一阶段的模型，获得对于红树林滨海湿地特定鸟类的分类模型，利用所述分类模型实现基于深度学习的鸟类识别；包括如下步骤：A.收集红树林滨海湿地原始图片数据集，对数据集的原始图片做水平翻转处理，增加一倍的数据量，得到红树林鸟类数据库，作为训练数据集；B.首先以大规模公开数据库为基础预训练深度网络Net1，使得该神经网络可以对大规模公开数据库进行分类；该大规模公开数据库中每一类的图片分类准确，同一个类别下的图片数量至少上百张，以利于对图像进行特征提取；接着修改大规模公开数据库预训练的深度网络，具体是：将深度网络最后一层分类层的类别数量从基于大规模公开数据库的类别总数改为基于CUB-200-2011鸟类数据库的类别总数；其次，将倒数两层的全连接层参数数量依次缩小，以适应小规模的数据库数据量；然后，用修改后的神经网络训练CUB-200-2011鸟类数据集...

【专利技术属性】
技术研发人员：邹月娴，陆超豪，
申请(专利权)人：北京大学深圳研究生院，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人