【技术实现步骤摘要】
一种基于JDC
‑
CRNN的鸟声检测方法与系统
[0001]本专利技术涉及鸟声检测的
,更具体地,涉及一种基于JDC
‑
CRNN的鸟声检测方法与系统。
技术介绍
[0002]鸟类作为一种分布广泛的动物,在自然界中扮演着重要角色,是环境质量的绝佳自然指标。在户外观察鸟类时,观鸟者常常只闻其声不见其影,因此从鸟声中发掘信息有着重要意义。通过音频数据分析,可以让计算机实现鸟声的自动化处理,并通过音频检测是否存在鸟类。机器学习和卷积神经网络的出现使得自动检测鸟声成为可能,鸟声自动化检测在一定程度上帮助了学者监测鸟类群落数量的变化趋势和生物系统中的物种多样性。
[0003]鸟声检测任务中所使用的鸟声数据集通常是弱标注的,这是因为音频中有时混杂着其他冗余信息。鸟声音频检测的难点在于,音频中的干扰信号过多、过强时如何能够准确敏感地感知到相对微弱的鸟叫声;另外具有发展潜力的一点是在保证准确性的前提下缩小算法模型的计算复杂度,使得模型在轻量化设备上仍具有较好的响应能力,让研究人员在户外使用移动端设备时仍可以方便地检测鸟声,减少信号不佳带来的不便或带给云端的计算负载增加的情况。
[0004]现有的解决方案JDC
‑
CNN(Joint Detection and Classification Convolution Neural Network)是Kong等人在2017年提出的。JDC
‑
CNN首先定义基于VGG(Visual Geometry ...
【技术保护点】
【技术特征摘要】
1.一种基于JDC
‑
CRNN的鸟声检测方法,其特征在于,包括:S1:获取带有鸟声标注信息的音频数据,对音频数据进行预处理,获得预处理后的音频数据;S2:将预处理后的音频数据转化为梅尔频谱图,并将梅尔频谱图以预设比例划分为训练集和验证集;S3:利用训练集对构建的基于JDC
‑
CRNN的鸟声检测模型进行预设轮次的训练,设置损失函数,调整鸟声检测检测模型的网络参数,获得训练后的鸟声检测模型;S4:设置早停机制,利用验证集对训练后的鸟声检测模型进行测试,获得优化后的鸟声检测模型;S5:获取待检测的音频数据,转化为梅尔频谱图;利用优化后的鸟声检测模型对待检测的音频数据的梅尔频谱图进行鸟声检测,获得鸟声检测结果。2.根据权利要求1所述的基于JDC
‑
CRNN的鸟声检测方法,其特征在于,对音频数据进行的预处理包括分段操作和滤波操作。3.根据权利要求1所述的基于JDC
‑
CRNN的鸟声检测方法,其特征在于,所述构建的基于JDC
‑
CRNN的鸟声检测模型包括依次连接的检测器、分类器和输出层;所述检测器的输出端还与输出层的输入端连接。4.根据权利要求3所述的基于JDC
‑
CRNN的鸟声检测方法,其特征在于,所述检测器包括第一最大池化层,第一最大池化层的输出端作为检测器的输出端;所述分类器包括依次连接的第一卷积层、第二最大池化层、第二卷积层、第三最大池化层、第三卷积层、第四最大池化层、堆叠处理层、第一递归层、第二递归层和第五最大池化层;输出层包括依次连接的前向传播单元和激活函数;前向传播单元的输入端作为输出层的输入端。5.根据权利要求4所述的基于JDC
‑
CRNN的鸟声检测方法,其特征在于,利用训练集对构建的基于JDC
‑
CRNN的鸟声检测模型进行预设轮次的训练的具体方法为:S3.1:将训练集中的梅尔频谱图输入检测器中,检测器对训练集中的梅尔频谱图沿时间轴方向进行压缩,检测是否存在鸟声,获得检测器结果,传递至输出层;S3.2:输出层对检测器结果进行处理,获得初始检测结果;若初始检测结果为0,则判定当前梅尔频谱图对应的音频数据中没有鸟声,将初始检测作为最终检测结果;若初始二值化结果为1,则返回检测器;S3.3:检测器将当前梅尔频谱图输入分类器中,还原为预处理后的音频数据,进行局部时频特征提取;再对局部时频特征沿频率轴方向进行压缩后堆叠,提取不同方向的时序全局特征,输出分类器结果;S3.4:输出层对分类器结果进行处理,获得最终检测结果;若最终检测结果为0,则判定当前梅尔频谱图对应的音频数据中没有鸟声;若最终检测结果为1,则判定当前梅尔频谱图对应的音频数据中存在鸟声;S3.5:重复步骤S3.1
‑
3.4,直到完成预设轮次的训练。6.根据权利要求5所述的基于JDC
‑
CRNN的鸟声检测方法,其特征在于,所述步骤S3.3的具体方法为:
S3.3.1:检测器将当前梅尔频谱图输入分类器中,还原为对应的预处理后的音频数据;S3.3.2:预处理后的音频数...
【专利技术属性】
技术研发人员:肖红,詹志伟,黄子豪,姜文超,
申请(专利权)人:广州凡沙智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。