一种稳健的鸟声提取方法、装置及计算机可读存储介质制造方法及图纸

技术编号：25273977 阅读：31 留言：0更新日期：2020-08-14 23:06

本发明专利技术公开了一种稳健的鸟声提取方法，包括：对音频信号进行预处理，得到带噪信号功率谱，通过最小值搜索法得到噪声功率谱估计；在预设的HBank滤波器组的基础上，将带噪信号功率谱和噪声功率谱估计转换到H域内进行分析，进而获得后验信噪比；根据所述后验信噪比以及引导判决法，得到H域的先验信噪比估计；对所述先验信噪比先进行平滑处理后求出其均值，进而得到有声帧的先验概率；再由设定的阈值判断当前帧是否为有声帧，并将连续的有声帧信号集合得到有声片段；通过线性预测法得到共振峰频率和共振峰宽度，进而判别有声段是否存在鸟声。本发明专利技术能够准确提取有声段，并自动剔除杂音，在低信噪比情况下也有良好效果，算法复杂度较低且实时性强。

全部详细技术资料下载

【技术实现步骤摘要】
一种稳健的鸟声提取方法、装置及计算机可读存储介质
本专利技术涉及生态监测及声信号识别
，特别是涉及一种稳健的鸟声提取方法、装置及计算机可读存储介质。
技术介绍
目前，中国作为拥有鸟类品种数目最多的国家，一直高度重视鸟类环境保护问题。通过鸟鸣声的研究，既可辨别物种，又能分析生物行为，在野生动物监测、农林驱赶害鸟、航空鸟撞等方面具有广阔的发展前景。鸟声研究的首要任务是将潜在鸟声片段从连续采集音频中分离出来。早期的鸟声提取工作都是采用人工检测的方法，由鸟声专家经过反复听音和谱图分析后，对存在鸟声的片段进行提取和标记。虽然人工提取能准确得到鸟声片段，但检测效率非常低，不利于处理海量的录音数据。随着话音活动检测技术的成熟发展，出现了一些自动提取鸟声片段的方法，但仍存在很多问题，包括提取性能、复杂度、普适性、实时性等。在现有技术下的提取鸟声方法中，存在着以下的缺点：基于能量检测的提取方法运算量低，但在低信噪比情况下无法正确判决；基于先验概率的提取方法运算量适中，检测性能较好，但对于突变噪声仍会存在误判现象；基于谱图分析的提取方法能较完整地得到含有鸟声的片段，但需要连续多帧信号才能构建谱图信息，运算量偏大，仅适合离线处理；基于高斯混合模型的提取方法在低信噪比情况下具有稳健的检测性能，算法复杂度适中，但需要不断调节模型参数，对于突变噪声会存在误判现象；基于深度学习的提取算法在样本量充足的情况下效果极佳，但算法复杂度高，前期需要训练大量的样本数据，过拟合和欠拟合会影响分类结果。
技术实现思路
...

【技术保护点】
1.一种稳健的鸟声提取方法，其特征在于，包括：/n对采集到的目标范围内的音频信号进行预处理，得到带噪信号功率谱，并对所述带噪信号功率谱进行平滑处理，通过最小值搜索法得到噪声功率谱估计；/n将所述带噪信号功率谱和所述噪声功率谱估计分别输入至预设的HBank滤波器组，得到H域内带噪信号功率谱和H域内噪声功率谱估计，并根据所述H域内带噪信号功率谱和所述H域内噪声功率谱估计，获得后验信噪比；其中，所述HBank滤波器组的相关域为H域；/n根据所述后验信噪比以及引导判决法，得到H域的先验信噪比估计；对所述先验信噪比进行平滑处理，得到平滑先验信噪比估计；根据所述平滑先验信噪比的均值，得到有声帧的先验概率；当所述概率值大于设定阈值时，当前帧判定为有声帧，并将连续的有声帧信号集合得到有声片段；/n在所述有声段期间，将当前帧与前续5帧信号合并为一个子片，计算子片的线性预测系数；对所述线性预测系数进行傅里叶变换，得到所述子片的线性预测模型的功率谱幅值响应；对所述功率谱幅值响应进行归一化处理，寻找谱峰对应的频点，继而获取到所述子片的共振峰频率和共振峰宽度；/n根据所述共振峰频率和所述共振峰宽度，对每个子片进...

【技术特征摘要】
1.一种稳健的鸟声提取方法，其特征在于，包括：
对采集到的目标范围内的音频信号进行预处理，得到带噪信号功率谱，并对所述带噪信号功率谱进行平滑处理，通过最小值搜索法得到噪声功率谱估计；
将所述带噪信号功率谱和所述噪声功率谱估计分别输入至预设的HBank滤波器组，得到H域内带噪信号功率谱和H域内噪声功率谱估计，并根据所述H域内带噪信号功率谱和所述H域内噪声功率谱估计，获得后验信噪比；其中，所述HBank滤波器组的相关域为H域；
根据所述后验信噪比以及引导判决法，得到H域的先验信噪比估计；对所述先验信噪比进行平滑处理，得到平滑先验信噪比估计；根据所述平滑先验信噪比的均值，得到有声帧的先验概率；当所述概率值大于设定阈值时，当前帧判定为有声帧，并将连续的有声帧信号集合得到有声片段；
在所述有声段期间，将当前帧与前续5帧信号合并为一个子片，计算子片的线性预测系数；对所述线性预测系数进行傅里叶变换，得到所述子片的线性预测模型的功率谱幅值响应；对所述功率谱幅值响应进行归一化处理，寻找谱峰对应的频点，继而获取到所述子片的共振峰频率和共振峰宽度；
根据所述共振峰频率和所述共振峰宽度，对每个子片进行鸟声或噪声的分类，统计所述有声段中鸟声子片和噪声子片的数量；通过比较所述鸟声子片数量和所述噪声子片数量，判断所述有声段中是否存在鸟声，若是，则对所述有鸟声的片段进行存储。

2.根据权利要求1所述的一种稳健的鸟声提取方法，其特征在于，根据所述共振峰频率和共振峰宽度对每个子片进行鸟声或噪声分类，并通过比较所述有声段中鸟声子片数量和噪声子片数量判断是否存在鸟声，若是，则对所述有鸟声的片段进行存储，包括：
所述共振峰频率大于1.5kHz时，所述子片判定为鸟声子片；
所述共振峰频率小于400Hz时，所述子片判定为噪声子片；
所述共振峰频率介于400Hz和1.5kHz之间，所述子片需要根据共振峰宽度进行分析；若所述共振峰宽度小于500Hz，所述子片判定为鸟声子片，反之判定为噪声子片；
统计所述有声段中的鸟声子片数量和噪声子片数量，若所述鸟声子片数量大于所述噪声子片数量，则所述有声段含有鸟声，并对所述有鸟声的片段进行存储。

3.根据权利要求1所述的一种稳健的鸟声提取方法，其特征在于，对所述HBank滤波器组进行参数设置：以频率FC为中心建立滤波器，在其左侧建立ML个滤波器，右侧建立MH个滤波器，共(ML+1+MH)个滤波器，所覆盖的线性频率范围为FL～FH。

4.根据权利要求1所述的一种稳健的鸟声提取方法，其特征在于，所述HBank滤波器组的函数表达式为：

所述HBank滤波器的中心频率表达式为：

5.根据权利要求1所述的一种稳健的鸟声提取方法，其特征在于，所述平滑先验信噪比的函数表达式为：
ζH(λ,b)＝αζ×ζH(λ-1...

【专利技术属性】
技术研发人员：张承云，郑泽鸿，陈庆春，凌嘉乐，肖波，
申请(专利权)人：广州大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人