一种基于聚类模型的鸟声识别方法技术

技术编号：39755351 阅读：10 留言：0更新日期：2023-12-17 23:54

本发明专利技术公开了一种基于聚类模型的鸟声识别方法

全部详细技术资料下载

【技术实现步骤摘要】
一种基于聚类模型的鸟声识别方法、装置和系统

[0001]本专利技术涉及生态监测
，尤其涉及一种基于聚类模型的鸟声识别方法
、
装置和系统
。

技术介绍

[0002]监测动物多样性的状况和趋势以及指示物种的种群水平对于评估生态系统健康
、
确定保护优先事项和指导保护决策至关重要，其中，鸟类被广泛用作监测目标
。
如果要利用深度学习实现鸟类物种多样性的监测往往要高度依赖于高质量的鸟声声纹库，而高质量的鸟声声纹库往往需要海量的时间和人工积累，因此如何在降低了人工处理需求的同时，实现更为精准的鸟类物种辨识，则成为了本行业一大难点
。
[0003]现有技术中采用的鸟声识别方法包括神经网络模型鸟声识别方法
、
基于语谱图和
MFCC
混合特征向量的鸟声识别方法以及基于小样本和
BTNN
模型的鸟声识别方法，然而以上三种鸟声识别方法均依赖于高质量鸟声声纹库或是一定量的标签鸟声数据
。
然而不论是高质量鸟声声纹库还是一定量的标签鸟声数据，都需要海量的时间和人工积累
。

技术实现思路

[0004]本专利技术提供了一种基于聚类模型的鸟声识别方法
、
装置和系统，以实现在降低了针对高质量鸟声声纹库的同时提高鸟类物种识别的精准性的技术效果
。
[0005]为了解决上述技术问题，本专利技术实施例提供了一种基于聚类模型的鸟声识别方法，包括以下步骤：<...

【技术保护点】

【技术特征摘要】
1.
一种基于聚类模型的鸟声识别方法，其特征在于，包括以下步骤：采集并获取待处理鸟声，并调用预设的鸟声音节检测算法对所述待处理鸟声进行音节检测，获得对应的第一鸟声；获得所述第一鸟声后，调用预设的鸟声音节预处理算法对所述第一鸟声进行鸟声音节预处理，获得对应的第二鸟声；根据所述第二鸟声对预设的鸟声音节聚类模型进行更新，并将所述第二鸟声输入更新后模型输出鸟声伪标签，并根据所述鸟声伪标签对所述待处理鸟声进行鸟声识别
。2.
如权利要求1所述的一种基于聚类模型的鸟声识别方法，其特征在于，所述调用预设的鸟声音节检测算法对所述待处理鸟声进行音节检测，获得对应的第一鸟声，具体包括：调用预设的数据标准化算法和对所述待处理鸟声进行数据归一化，获得对应第一输出数据；并调用预设的预加重算法和分帧加窗算法对所述第一输出数据进行数据预加重和分帧加窗处理，获得对应第二输出数据；对所述第二输出数据进行多特征提取处理，获得所述第一鸟声
。3.
如权利要求2所述的一种基于聚类模型的鸟声识别方法，其特征在于，所述对所述第二输出数据进行多特征提取处理，获得所述第一鸟声，具体为：计算所述第二输出数据的每帧数据的频率平坦度，并将计算获得的每帧频率平坦度与预设的平坦度阈值进行比较，继而根据比较结果确定每帧数据对应的平坦度指示向量；计算所述第二输出数据的每帧数据的均值归一化函数，并将计算获得的每帧均值归一化函数与预设的音高阈值进行比较，继而根据比较结果确定每帧数据对应的音高指示向量；计算所述第二输出数据的每帧数据的短时数据，并将计算获得的每帧短时数据与全部所述短时数据的均值进行比较，继而根据比较结果确定每帧数据对应的短时指示向量；根据计算获得的所述平坦度指示向量
、
所述音高指示向量和所述短时指示向量对所述第二输出数据进行筛选，并将筛选后第二输出数据作为所述第一鸟声
。4.
如权利要求1所述的一种基于聚类模型的鸟声识别方法，其特征在于，所述调用预设的鸟声音节预处理算法对所述第一鸟声进行鸟声音节预处理，获得对应的第二鸟声，具体为：对所述第一鸟声进行数据增强输出增强后鸟声，并对所述增强后鸟声进行短语处理；短语处理后，依次对所述增强后鸟声进行傅里叶变换和对数能量谱提取，并将提取获得的鸟声音节谱图作为所述第二鸟声
。5.
如权利要求4所述的一种基于聚类模型的鸟声识别方法，其特征在于，所述依次对所述增强后鸟声进行傅里叶变换和对数能量谱提取，并将提取获得的鸟声音节谱图作为所述第二鸟声，具体为：对所述增强后鸟声的信号类型进行傅里叶变换，获得对应频域鸟声；对所述频域鸟声进行对数能量谱提取，获得对应对数频谱图；按照预设的标准尺寸对所述对数频谱图进行图像缩放处理，获得所述鸟声音节谱图，并将所述鸟声音节谱图作为所述第二鸟声
。...

【专利技术属性】
技术研发人员：陈庆春，周棣锋，
申请(专利权)人：广州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人