一种基于多特征融合和组合模型的鸟声识别方法技术

技术编号:31083606 阅读:17 留言:0更新日期:2021-12-01 12:32
本发明专利技术公开了一种基于多特征融合和组合模型的鸟声识别方法,包括:对读取的原始鸟声音频进行预处理,包括预加重和分帧加窗;提取鸟声的梅尔倒谱系数、梅尔滤波后的能量系数、短时过零率和短时频谱质心四种特征,分别归一化后进行纵向拼接形成融合特征;绘制STFT语谱图;将融合特征和绘制的STFT语谱图分别输入构建的两个基于Inception模块的CNN模型进行训练,训练完成后将两个模型输出的概率数组进行拼接形成一个特征数组,并将该特征数组作为ANN模型的输入进行训练,训练完成后加载上述三个模型的最优参数;将待测的任一鸟声音频输入加载最优参数后的三个模型,得到鸟声识别分类结果。本发明专利技术可提高不同鸟声之间特征的差异性,并且提高了鸟声识别准确率。并且提高了鸟声识别准确率。并且提高了鸟声识别准确率。

【技术实现步骤摘要】
一种基于多特征融合和组合模型的鸟声识别方法


[0001]本专利技术涉及一种基于多特征融合和组合模型的鸟声识别方法,属于鸟鸣声分类识别的


技术介绍

[0002]鸟类是自然生态系统的重要组成部分,由于其对所生活的生态环境的变化十分敏感且易被观察和研究,因此对鸟类的监测和识别有助于对生态环境的监测,对生态环境保护工作的开展具有重大意义。鸟类监测是国内外研究的一个重要领域,传统的鸟类监测主要依赖于鸟类的形态特征差异完成,而在听觉上鸟鸣声中也包含着独有的特征,并且具有大范围性、稳定性、低干扰等优点,因此对鸟声识别的研究显得尤为重要。
[0003]鸟声识别的一般过程主要是预处理、特征参数提取、分类方法选择三个方面。目前国内外在鸟声识别技术上的改进主要是在于特征参数提取上,然后使用深度学习的方法构建神经网络进行训练完成鸟声识别。然而现有方法所提取的鸟声特征多基于人声领域的特征且较为单一,识别效果易受外界环境噪声影响。为解决此问题提出一种基于多特征融合和组合模型的鸟声识别方法。

技术实现思路

[0004]为解决现有的鸟声识别方本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于多特征融合和组合模型的鸟声识别方法,其特征在于,包括以下步骤:步骤1、对读取的原始鸟声音频进行预处理,包括预加重和分帧加窗;步骤2、对预处理后的原始鸟声音频提取鸟声的梅尔倒谱系数、梅尔滤波后的能量系数、短时过零率和短时频谱质心四种特征,并对四种特征分别归一化后进行纵向拼接形成一个融合特征;以及,对预处理后的原始鸟声音频经短时傅里叶变换STFT的结果绘制STFT语谱图;步骤3、将形成的一个融合特征和绘制的STFT语谱图分别输入构建的两个基于Inception模块的CNN模型进行训练,训练完成后将两个模型输出的概率数组进行拼接形成一个特征数组,并将该特征数组作为ANN模型的输入进行训练,训练完成后加载上述三个模型的最优参数;步骤4、将待测的任一鸟声音频输入加载最优参数后的三...

【专利技术属性】
技术研发人员:周晓彦欧昀李大鹏刘文强
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1