一种基于大数据训练的鸟类图像识别系统及方法技术方案

技术编号:27836360 阅读:31 留言:0更新日期:2021-03-30 12:03
本发明专利技术公开了一种基于大数据训练的鸟类图像识别系统及方法,包括信息处理模块、移动端、图像数据库、粗图像数据集、候选图像集和模型训练模块,所述移动端与信息处理模块连接,所述粗图像数据集与信息处理模块连接,所述候选图像集与粗图像数据集连接,所述图像数据库与候选图像集连接,所述模型训练模块与图像数据库和信息处理模块连接。本发明专利技术涉及图像识别技术领域,具体是提供了一种基于大数据训练的鸟类图像识别系统及方法,利用深度卷积神经网络为鸟类图像识别建立更加精确的识别模型,相对传统机器学习方法,基于鸟类图像特征的深度卷积网络识别模型优势在于可以自动提取高维的鸟类图像特征,实现鸟类图像特征的自动学习。习。习。

【技术实现步骤摘要】
一种基于大数据训练的鸟类图像识别系统及方法


[0001]本专利技术涉及图像识别
,具体是指一种基于大数据训练的鸟类图像识别系统及方法。

技术介绍

[0002]机器学习技术和人工智能技术(深度学习技术)的发展和应用,推动了鸟类自动识别技术的发展。传统机器学习技术与鸟类声音特征、图像特征相结合是比较早期的鸟类自动识别技术。
[0003]鸟类声音是区分不同鸟种的重要生物信号。以鸟类声音数据作为分类特征,再结合不同的机器学习方法一定程度上可以识别鸟类种类。鸟类图像包含了鸟类外形、颜色、纹理、不变几何特性等,这些特征很大程度上可以作为区分鸟类种类差异的直观指标。基于此,融合图像处理技术(图像特征)与传统机器学习技术的研究报告相继诞生;不过因受限于鸟类图像质量,总体模型识别精度不高。
[0004]目前可用于鸟类自动识别的技术有基于鸟类图像特征的传统机器学习方法;传统上图像特征的提取是通过构建不同类型给的局部特征提取器以人工预处理的方式完成的,局部特征提取算法选择的恰当与否直接影响图像分类结果,整体上,局部图像特征提取算法的选择对先验知识的依赖性以及图像特征的非自动学习性限制了传统鸟类图像识别技术的应用。

技术实现思路

[0005]针对上述情况,为克服现有技术的缺陷,本专利技术提供一种基于大数据训练的鸟类图像识别系统及方法,利用深度卷积神经网络为鸟类图像识别建立更加精确的识别模型,相对传统机器学习方法,基于鸟类图像特征的深度卷积网络识别模型优势在于可以自动提取高维的鸟类图像特征,实现鸟类图像特征的自动学习。
[0006]本专利技术采取的技术方案如下:本专利技术一种基于大数据训练的鸟类图像识别系统,包括信息处理模块、移动端、图像数据库、粗图像数据集、候选图像集和模型训练模块,所述移动端与信息处理模块连接,所述粗图像数据集与信息处理模块连接,所述候选图像集与粗图像数据集连接,所述图像数据库与候选图像集连接,所述模型训练模块与图像数据库和信息处理模块连接。
[0007]进一步地,所述粗图像数据集包括搜索关键词库、未下载链接库和已下载链接库。
[0008]进一步地,所述信息处理模块包括神经网络模型处理单元和逻辑计算处理单元,所述神经网络模型处理单元与模型训练模块连接。
[0009]进一步地,所述模型训练模块中设有鸟类图像识别模型。
[0010]本专利技术还公开了一种基于大数据训练的鸟类图像识别方法,包括如下步骤;
[0011]步骤一,鸟类图像爬取:利用爬虫程序收集鸟类图像,建立搜索关键词库,每一个关键词都对应着一个鸟类的中英文名称;爬虫程序遍历关键词库,将关键词按相应内容使
用多线程的方式同时发送多个POST请求规则向搜索引擎服务器发送请求,获取搜索引擎服务器反馈的数据,此时反馈的数据为相应关键词检索到的图片集合页面,然后将该页面下载并转换为字符串格式,通过预先写好的正则表达式对字符串进行提取,提取网页中所有被关键词检索得到的图片链接,提取链接后保存图片链接到未下载链接库;对比未下载链接库与已下载链接库把已经下载过的链接从未下载链接库中去除,然后对提取的图片链接进行下载,下载时需要启动守护进程,防止图片下载超时,对于下载超时的图片取消下载直接跳过并进行下一张图片的下载,图片下载后保存图片链接到已下载链接库,并将已下载图片保存至候选图像集;
[0012]步骤二,图像清洗及人工分类:对候选图像集中以下2种鸟类图像进行排除:(1)非真实场景图图片,包括鸟类的卡通画图片、鸟类图标、手绘鸟类图片以及其他可以直接分辨出的非真实场景图片;(2)真实场景图片,图片主题不符合检索要求的和图片中目标样本过小或严重遮挡的图片;
[0013]通过初步数据清洗操作后,再对一副图中同时存在多种鸟类图像的图片进行图像鉴定和图像分类,将经过数据清洗、图像鉴定和图像分类后的鸟类图像存入图像数据库中;
[0014]步骤三,鸟类图像识别模型训练:采用开源的ResNet深度卷积网络架构建立鸟类图像识别模型,所述ResNet深度卷积网络主要由初级卷积层、4个连续卷积层组以及末端分类层组成;
[0015]鸟类图像识别模型训练时,对图像数据库进行随机抽样,随机抽取80%作为训练样本,抽取10%作为验证样本,剩余10%作为测试样本,初始学习率设置为0.005,每经过7轮学习率缩小为当前10%,一共训练50轮,每一次训练结束后进行一次验证;
[0016]将鸟类图像识别模型存入神经网络模型处理单元中;
[0017]步骤四,移动端架构:构建手机小程序作为移动端,通过移动端采集并输入图像,图像将会传入逻辑计算处理单元,逻辑计算处理单元调用神经网络模型处理单元中的鸟类图像识别模型计算得出图像中是否存在鸟,鸟类的分类信息、数量信息和位置信息返回给移动端;
[0018]步骤五,利用爬虫程序爬取和收集由移动端上传的鸟类图片,更新图像数据库,通过更新图像数据库并重新训练鸟类图像识别模型,并对神经网络模型处理单元中的鸟类图像识别模型进行更新。
[0019]进一步地,所述鸟类图像识别模型中鸟类图像输入尺度为:224*224*3。
[0020]进一步地,所述逻辑计算处理单元中设有逻辑层,所述逻辑层由Flask实现。
[0021]进一步地,所述抽样的标准为鸟类外接矩形面积对鸟类图像总面积的占比不低于0.2。
[0022]采用上述结构本专利技术取得的有益效果如下:本方案不仅有利于辅助湿地野生动物保护工作,而且利于面向社会公众开展鸟类知识的科普,对推动社会公众参加鸟类保护;相对传统机器学习方法,基于鸟类图像特征的深度卷积网络方法优势在于可以自动提取高维的鸟类图像特征,实现鸟类图像特征的自动学习;同时,利用移动端的设置方便用户使用,提高用户的使用积极性。
附图说明
[0023]附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:
[0024]图1为本专利技术一种基于大数据训练的鸟类图像识别系统的整体构架图;
[0025]图2为本专利技术一种基于大数据训练的鸟类图像识别系统科水平上水鸟测试数据的模型识别精度图;
[0026]图3为本专利技术一种基于大数据训练的鸟类图像识别系统属水平上水鸟测试数据的模型识别精度图;
[0027]图4为本专利技术一种基于大数据训练的鸟类图像识别系统种水平上水鸟测试数据的模型识别精度图;
[0028]图5为本专利技术一种基于大数据训练的鸟类图像识别系统鸟类外接矩形比率对模型分类准确性的影响图。
具体实施方式
[0029]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例;基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0030]在本专利技术的描述中,需要理解的是,术语“上”、“本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据训练的鸟类图像识别系统,其特征在于,包括信息处理模块、移动端、图像数据库、粗图像数据集、候选图像集和模型训练模块,所述移动端与信息处理模块连接,所述粗图像数据集与信息处理模块连接,所述候选图像集与粗图像数据集连接,所述图像数据库与候选图像集连接,所述模型训练模块与图像数据库和信息处理模块连接。2.根据权利要求1所述的一种基于大数据训练的鸟类图像识别系统,其特征在于,所述粗图像数据集包括搜索关键词库、未下载链接库和已下载链接库。3.根据权利要求1所述的一种基于大数据训练的鸟类图像识别系统,其特征在于,所述信息处理模块包括神经网络模型处理单元和逻辑计算处理单元,所述神经网络模型处理单元与模型训练模块连接。4.根据权利要求3所述的一种基于大数据训练的鸟类图像识别系统,其特征在于,所述模型训练模块中设有鸟类图像识别模型。5.一种基于大数据训练的鸟类图像识别方法,其特征在于,包括如下步骤;步骤一,鸟类图像爬取:利用爬虫程序收集鸟类图像,建立搜索关键词库,每一个关键词都对应着一个鸟类的中英文名称;爬虫程序遍历关键词库,将关键词按相应内容使用多线程的方式同时发送多个POST请求规则向搜索引擎服务器发送请求,获取搜索引擎服务器反馈的数据,此时反馈的数据为相应关键词检索到的图片集合页面,然后将该页面下载并转换为字符串格式,通过预先写好的正则表达式对字符串进行提取,提取网页中所有被关键词检索得到的图片链接,提取链接后保存图片链接到未下载链接库;对比未下载链接库与已下载链接库把已经下载过的链接从未下载链接库中去除,然后对提取的图片链接进行下载,下载时需要启动守护进程,防止图片下载超时,对于下载超时的图片取消下载直接跳过并进行下一张图片的下载,图片下载后保存图片链接到已下载链接库,并将已下载图片保存至候选图像集;步骤二,图像清洗及人工分类:对候选图像集中以下2种鸟类图像进行排除:(1)非真实场景图图...

【专利技术属性】
技术研发人员:孙月潘子杰周脚根
申请(专利权)人:淮阴师范学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1