【技术实现步骤摘要】
一种鸟声识别模型的训练方法、分类方法、设备及介质
[0001]本专利技术涉及深度学习领域,尤其是一种鸟声识别模型的训练方法、分类方法、设备及介质。
技术介绍
[0002]世界上有近10000种鸟类,相关数据表明,部分鸟类种群数量呈现下降趋势,人类对鸟类的保护已经到了刻不容缓的地步,包括中国在内的世界各国都明确将保护鸟类以法规的形式确定下来。鸟种丰富度和鸟类活动活跃度往往能推断出这个地区的环境质量的好坏,因此如何监测鸟类的方式是保护鸟类的重要一步。目前已经有许多方法来监测鸟类,如传统的人工样点法、样线法以及人工布置红外相机监测等,传统的人工监测方法存在着效率低、覆盖面窄的缺陷,布置的红外相机还受拍摄角度以及供电的影响。相比于用照片或视频来观察鸟喙或者鸟的羽毛等形态特征,鸟鸣声所蕴含的生物学信息特征也有很大的差异,这种差异可以帮助区分不同物种的鸟。因此,基于鸣声的鸟类监测是一种新兴方法,我们可以通过提取和分析鸟鸣声所蕴含的信息来鉴别鸟的物种,统计生态区的鸟类分布特点,从而帮助了解生物多样性,进而监控生态系统的平衡。
[0 ...
【技术保护点】
【技术特征摘要】
1.一种鸟声识别模型的训练方法,其特征在于,包括:获取鸟声数据集和噪声数据集,并从所述鸟声数据集中选取多个鸟声切片数据;对所述鸟声切片数据进行第一随机数据增强处理;所述第一随机数据增强处理包括对所述鸟声切片数据进行所述噪声数据集的叠加处理、对所述鸟声切片数据进行时间区间位移变换处理、对所述鸟声切片数据进行第一音高变换处理以及对所述鸟声切片数据进行第一音量变换处理中的至少一种处理,以及将至少一种处理的结果进行组合处理;对第一随机数据增强处理结果进行变换增强处理,得到声谱图数据;根据所述声谱图数据对识别模型进行训练,得到鸟声识别模型。2.根据权利要求1所述鸟声识别模型的训练方法,其特征在于:所述对所述鸟声切片数据进行第一随机数据增强处理,包括:从所述噪声数据集中选取与所述鸟声切片数据长度相同的噪声切片数据,根据预设信噪比范围将所述噪声切片数据与所述鸟声切片数据进行叠加处理,得到叠加处理结果;根据预设时间间隔将所述鸟声切片数据进行划分,得到多个划分数据,并根据第一预设规则将所述划分数据进行拼接,得到时间区间位移变换处理结果;根据预设音调倍数范围对所述鸟声切片数据进行第一音高变换处理,得到第一音高变换处理结果;获取所述鸟声切片数据的幅度值,根据所述幅度值与幅度增益因子的乘积对所述鸟声切片数据进行第一音量变换处理,得到第一音量变换处理结果;将所述叠加处理结果、时间区间位移变换处理结果、第一音高变换处理结果以及第一音量变换处理结果中的至少一个根据第二预设规则进行组合处理。3.根据权利要求1或2所述鸟声识别模型的训练方法,其特征在于:所述对第一随机数据增强处理结果进行变换增强处理,得到声谱图数据,包括:对第一随机数据增强处理结果进行傅里叶变换处理以及梅尔滤波处理,得到低频率分辨率的鸟声声谱图;对所述低频率分辨率的鸟声声谱图进行第二随机数据增强处理;对第二随机数据增强处理结果进行归一化处理,得到所述声谱图数据。4.根据权利要求3所述鸟声识别模型的训练方法,其特征在于:所述对第一随机数据增强处理结果进行傅里叶变换处理以及梅尔滤波处理,得到低频率分辨率的鸟声声谱图,包括:对所述第一随机数据增强处理结果进行数据分帧,得到多帧音频数据;对所述音频数据进行加窗操作,对加窗操作结果进行快速傅里叶变换,并根据快速傅里叶变换结果的平方确定每一帧所述音频数据的功率谱;根据每一所述功率谱以及梅尔滤波器组,确定每一帧所述音频数据的梅尔对数功率谱;将所述梅尔对数功率谱按时间顺序进行拼接,得到所述低频率分辨率的鸟声声谱图。5.根据权利要求3所述鸟声识别模型的训练方法,其...
【专利技术属性】
技术研发人员:李清荣,张承云,陈庆春,詹海松,李一帆,孟瑞德,余上,
申请(专利权)人:广州灵感生态科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。