当前位置: 首页 > 专利查询>广州大学专利>正文

一种基于深度学习技术的大规模鸟声识别方法技术

技术编号:44291272 阅读:31 留言:0更新日期:2025-02-14 22:25
本申请涉及人工智能与鸟类生态学交叉领域,其具体地公开了一种基于深度学习技术的大规模鸟声识别方法,该方法通过项目区域录音设备采集鸟声音频,利用Bird audio detection challenge 2018数据集训练鸟声事件检测模型,并用野外录音数据进行类别预测,分离出有效鸟声和背景噪声;同时结合中国观鸟记录中心的鸟种目录和Xeno‑Canto的音频文件,构建鸟声识别数据集,使用背景噪声和鸟声识别数据集训练鸟声识别模型,并进行验证;最终,将有效鸟声数据输入模型进行标签预测,以识别鸟声。本发明专利技术旨在通过深度学习技术,对在建项目区域开展广泛的鸟类声音识别,从而节省数据处理成本,提高复杂场景下的识别准确率。

【技术实现步骤摘要】

本申请涉及人工智能与鸟类生态学交叉领域,且更为具体地,涉及一种基于深度学习技术的大规模鸟声识别方法


技术介绍

1、在鸟类生态学和环境监测领域,专家们一直在探索如何更有效地监测和研究鸟类。主动鸣声监测是一种传统方法,通过人工录音来捕捉鸟类鸣声,但这种方法成本高且可能影响鸟类自然行为。随着技术进步,被动声监测技术开始流行,它通过安装传感器自动记录声音,减少了人为偏差,但需要大量人工后期进行分析鉴定。

2、有不少研究者将人工智能(ai)引入被动监测,尤其是深度学习算法,为这一领域带来了革命性的变化。ai可以处理大量数据,提高监测效率,减少人力需求。例如,基于densenet121网络结构的ai模型在鸟声识别上取得了96.9%的高准确率。

3、然而,目前大部分算法主要只能针对既定数据集中的有限的鸟声音频进行识别,但在包括多类别鸟种的带噪自然环境下的综合识别能力并不理想,除了算法本身的鲁棒性尚欠缺,更是因为缺乏足够多样和可靠的鸟声录音资料来训练ai模型。

4、此外,目前的ai研究大多集中在识别鸟类类别上,而对于鸟类发声行为与生态本文档来自技高网...

【技术保护点】

1.一种基于深度学习技术的大规模鸟声识别方法,其特征在于,包括:

2.根据权利要求1所述的基于深度学习技术的大规模鸟声识别方法,其特征在于,所述S4,包括:

3.根据权利要求2所述的基于深度学习技术的大规模鸟声识别方法,其特征在于,所述S5,包括:

4.根据权利要求3所述的基于深度学习技术的大规模鸟声识别方法,其特征在于,在所述S56过程中,采用逐步融合策略将基于角度间隔的损失函数融入交叉熵损失函数,具体过程为:

5.根据权利要求4所述的基于深度学习技术的大规模鸟声识别方法,其特征在于,在所述S56过程中,采用自适应学习率调整策略提升模型的...

【技术特征摘要】

1.一种基于深度学习技术的大规模鸟声识别方法,其特征在于,包括:

2.根据权利要求1所述的基于深度学习技术的大规模鸟声识别方法,其特征在于,所述s4,包括:

3.根据权利要求2所述的基于深度学习技术的大规模鸟声识别方法,其特征在于,所述s5,包括:

4.根据权利要求3所述的基于深度学习技术的大规模鸟声识别方法,其特征在于,在所述s56过程中,采用逐步融合策略将基于角度间隔的损失函数融入交叉熵损失函数,具体过程为:

5.根据权利要求4所述的基于深度学习技术的大规模鸟声识别方法,其特征在于,在所述s56...

【专利技术属性】
技术研发人员:王杰胡涛李金晖袁旻忞
申请(专利权)人:广州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1