当前位置: 首页 > 专利查询>广州大学专利>正文

一种基于聚类模型的鸟声识别方法技术

技术编号:39755351 阅读:10 留言:0更新日期:2023-12-17 23:54
本发明专利技术公开了一种基于聚类模型的鸟声识别方法

【技术实现步骤摘要】
一种基于聚类模型的鸟声识别方法、装置和系统


[0001]本专利技术涉及生态监测
,尤其涉及一种基于聚类模型的鸟声识别方法

装置和系统


技术介绍

[0002]监测动物多样性的状况和趋势以及指示物种的种群水平对于评估生态系统健康

确定保护优先事项和指导保护决策至关重要,其中,鸟类被广泛用作监测目标

如果要利用深度学习实现鸟类物种多样性的监测往往要高度依赖于高质量的鸟声声纹库,而高质量的鸟声声纹库往往需要海量的时间和人工积累,因此如何在降低了人工处理需求的同时,实现更为精准的鸟类物种辨识,则成为了本行业一大难点

[0003]现有技术中采用的鸟声识别方法包括神经网络模型鸟声识别方法

基于语谱图和
MFCC
混合特征向量的鸟声识别方法以及基于小样本和
BTNN
模型的鸟声识别方法,然而以上三种鸟声识别方法均依赖于高质量鸟声声纹库或是一定量的标签鸟声数据

然而不论是高质量鸟声声纹库还是一定量的标签鸟声数据,都需要海量的时间和人工积累


技术实现思路

[0004]本专利技术提供了一种基于聚类模型的鸟声识别方法

装置和系统,以实现在降低了针对高质量鸟声声纹库的同时提高鸟类物种识别的精准性的技术效果

[0005]为了解决上述技术问题,本专利技术实施例提供了一种基于聚类模型的鸟声识别方法,包括以下步骤:<br/>[0006]采集并获取待处理鸟声,并调用预设的鸟声音节检测算法对所述待处理鸟声进行音节检测,获得对应的第一鸟声;
[0007]获得所述第一鸟声后,调用预设的鸟声音节预处理算法对所述第一鸟声进行鸟声音节预处理,获得对应的第二鸟声;
[0008]根据所述第二鸟声对预设的鸟声音节聚类模型进行更新,并将所述第二鸟声输入更新后模型输出鸟声伪标签,并根据所述鸟声伪标签对所述待处理鸟声进行鸟声识别

[0009]本专利技术提供的鸟声识别方法在采集到待处理鸟声后,通过调用鸟声音节检测算法对待处理鸟声进行音节检测,进而获得第一鸟声

本专利技术通过鸟声音节检测算法提取获得待处理鸟声中的鸟声音节,为后续对第一鸟声进行预处理和聚类提供数据基础,也提高了后续根据所述第一鸟声进行鸟声识别的准确性

[0010]在获得第一鸟声后,系统调用了鸟声音节预处理算法对第一鸟声进行再处理,以使处理后获得的第二鸟声满足后续更新鸟声音节聚类模型的标准,同时对第一鸟声进行鸟声音节预处理还提高了后续鸟声识别的准确性和科学性

[0011]通过鸟声音节预处理后的获得的第二鸟声对鸟声音节聚类模型进行更新,提高了该鸟声音节聚类模型对所述第二鸟声进行聚类识别的精准性和敏感度,更新后的鸟声音节聚类模型将提高对所述第二鸟声进行聚类的敏锐度

同时,由于该鸟声音节聚类模型可根
据处理后的待处理鸟声即第二鸟声进行更新,因此无需如现有技术一般需要高质量鸟声声纹库,而只需通过该鸟声音节聚类模型实现对待处理鸟声的鸟声识别,进而达到对该待处理鸟声对应的鸟类的物种辨识,进而降低了需要海量人力资源及时间资源生成的高质量鸟声声纹库

[0012]作为优选例子,所述调用预设的鸟声音节检测算法对所述待处理鸟声进行音节检测,获得对应的第一鸟声,具体包括:
[0013]调用预设的数据标准化算法和对所述待处理鸟声进行数据归一化,获得对应第一输出数据;
[0014]并调用预设的预加重算法和分帧加窗算法对所述第一输出数据进行数据预加重和分帧加窗处理,获得对应第二输出数据;
[0015]对所述第二输出数据进行多特征提取处理,获得所述第一鸟声

[0016]为了提高提取获得的第一鸟声的准确性和科学性,本专利技术还提供了一种鸟声音节检测算法的具体实现方式,该检测算法的具体步骤包括:数据归一化

预加重以及分帧加窗

对所述第一鸟声进行数据归一化,即对由各个独立的鸟声采集通道采集并降噪了的待处理鸟声进行数据标准化,便于后续系统对该待处理鸟声进行数据预处理和聚类处理

同时,对所述待处理鸟声进行数据归一化还可消除由于采集该待处理鸟声的录音模块和降噪模块带来的信号幅度差异,并提升了后续聚类模型进行预测和识别的结果准确性

[0017]数据归一化处理后,为了提升鸟声信号中的高频分量,进一步提高后续聚类模型的聚类准确性,本专利技术还通过调用预加重算法对第一输出数据进行预加重处理,可有效弥补信号高频部分的损失

而由于任意音频信号从整体上看为非平稳信号,但从局部上却可以将其看作稳定信号,因此为了提高后续提取获得的第一鸟声的信号稳定性,系统通过分帧加窗算法对数据进行进一步处理,为其输入一个稳定的信号,进而保证其后续提取获得的数据信号稳定性

处理后,系统将对处理获得的第二输出数据进行多特征提取处理,进而获得第一鸟声

[0018]作为优选例子,所述对所述第二输出数据进行多特征提取处理,获得所述第一鸟声,具体为:
[0019]计算所述第二输出数据的每帧数据的频率平坦度,并将计算获得的每帧频率平坦度与预设的平坦度阈值进行比较,继而根据比较结果确定每帧数据对应的平坦度指示向量;
[0020]计算所述第二输出数据的每帧数据的均值归一化函数,并将计算获得的每帧均值归一化函数与预设的音高阈值进行比较,继而根据比较结果确定每帧数据对应的音高指示向量;
[0021]计算所述第二输出数据的每帧数据的短时数据,并将计算获得的每帧短时数据与全部所述短时数据的均值进行比较,继而根据比较结果确定每帧数据对应的短时指示向量;
[0022]根据计算获得的所述平坦度指示向量

所述音高指示向量和所述短时指示向量对所述第二输出数据进行筛选,并将筛选后第二输出数据作为所述第一鸟声

[0023]为了进一步提高获得的第一鸟声的准确性和科学性,本专利技术还提供了一种多特征提取处理方法,通过分别计算第二输出数据的频率平坦度

均值归一化函数和短时数据,并
将以上三者计算结果汇总整合,即可获得第一鸟声

系统通过计算第二输出数据中每一帧数据的频率平坦度可确定每帧数据是否为白噪声,并根据计算获得的每帧数据的频率平坦度对第二输出数据进行筛选,以此确定并筛选获得所述第二输出数据中除了白噪声之外的有效数据,进而提高第一鸟声中有效鸟声声纹数据的占比率并进一步提高了后续鸟声识别的精准性

[0024]在计算确定了每帧数据的频率平坦度后,系统将计算每帧数据的均值归一化函数,即计算确定每帧数据中鸟声的音高,确定了每帧数据的音高后即可根据计算获得的音高更准确地提取第二输出数据即待处理鸟声中语音能量更高的部分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于聚类模型的鸟声识别方法,其特征在于,包括以下步骤:采集并获取待处理鸟声,并调用预设的鸟声音节检测算法对所述待处理鸟声进行音节检测,获得对应的第一鸟声;获得所述第一鸟声后,调用预设的鸟声音节预处理算法对所述第一鸟声进行鸟声音节预处理,获得对应的第二鸟声;根据所述第二鸟声对预设的鸟声音节聚类模型进行更新,并将所述第二鸟声输入更新后模型输出鸟声伪标签,并根据所述鸟声伪标签对所述待处理鸟声进行鸟声识别
。2.
如权利要求1所述的一种基于聚类模型的鸟声识别方法,其特征在于,所述调用预设的鸟声音节检测算法对所述待处理鸟声进行音节检测,获得对应的第一鸟声,具体包括:调用预设的数据标准化算法和对所述待处理鸟声进行数据归一化,获得对应第一输出数据;并调用预设的预加重算法和分帧加窗算法对所述第一输出数据进行数据预加重和分帧加窗处理,获得对应第二输出数据;对所述第二输出数据进行多特征提取处理,获得所述第一鸟声
。3.
如权利要求2所述的一种基于聚类模型的鸟声识别方法,其特征在于,所述对所述第二输出数据进行多特征提取处理,获得所述第一鸟声,具体为:计算所述第二输出数据的每帧数据的频率平坦度,并将计算获得的每帧频率平坦度与预设的平坦度阈值进行比较,继而根据比较结果确定每帧数据对应的平坦度指示向量;计算所述第二输出数据的每帧数据的均值归一化函数,并将计算获得的每帧均值归一化函数与预设的音高阈值进行比较,继而根据比较结果确定每帧数据对应的音高指示向量;计算所述第二输出数据的每帧数据的短时数据,并将计算获得的每帧短时数据与全部所述短时数据的均值进行比较,继而根据比较结果确定每帧数据对应的短时指示向量;根据计算获得的所述平坦度指示向量

所述音高指示向量和所述短时指示向量对所述第二输出数据进行筛选,并将筛选后第二输出数据作为所述第一鸟声
。4.
如权利要求1所述的一种基于聚类模型的鸟声识别方法,其特征在于,所述调用预设的鸟声音节预处理算法对所述第一鸟声进行鸟声音节预处理,获得对应的第二鸟声,具体为:对所述第一鸟声进行数据增强输出增强后鸟声,并对所述增强后鸟声进行短语处理;短语处理后,依次对所述增强后鸟声进行傅里叶变换和对数能量谱提取,并将提取获得的鸟声音节谱图作为所述第二鸟声
。5.
如权利要求4所述的一种基于聚类模型的鸟声识别方法,其特征在于,所述依次对所述增强后鸟声进行傅里叶变换和对数能量谱提取,并将提取获得的鸟声音节谱图作为所述第二鸟声,具体为:对所述增强后鸟声的信号类型进行傅里叶变换,获得对应频域鸟声;对所述频域鸟声进行对数能量谱提取,获得对应对数频谱图;按照预设的标准尺寸对所述对数频谱图进行图像缩放处理,获得所述鸟声音节谱图,并将所述鸟声音节谱图作为所述第二鸟声
。...

【专利技术属性】
技术研发人员:陈庆春周棣锋
申请(专利权)人:广州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1