一种辅助鸟类繁殖期的物候研究的鸟类声音识别方法技术

技术编号:16606490 阅读:61 留言:0更新日期:2017-11-22 16:29
一种辅助鸟类繁殖期的物候研究的鸟类声音识别方法,其特征在于,首先读取现场的录音片段,声音中包含着若干鸟类鸣声的片段,然后识别算法会识别录音中叫声片段所属的鸟类的种类,给出一个识别的可信度,并且记录下这段声音的实际录制日期,最后结合算法的识别结果计算出该地区全部录音中这种发出鸣声的鸟类的数量,也就是进入繁殖期的鸟类的数量,当某个时间以后这个数量超过一个预先设定的阈值以后,即可认为在该地区这种鸟类从这个时候开始进入繁殖期,反之,当数量减少超过一个阈值以后,即可认为该种鸟结束了繁殖期。

A bird sound recognition method for studying phenology of birds during breeding period

The bird sound recognition method of phenological research an auxiliary bird breeding period, which is characterized in that the first reading of the live recording of sound clips, contains several bird song fragments, and then recognition algorithm will identify the types of birds in the recording sound fragment, given a recognition of the credibility, and record it the actual sound recording date, finally combining the algorithm recognition results calculated the area all recordings issued a number of birds chirp, is to enter the number of birds breeding period, when a certain time after this number exceeds a preset threshold, can be seen in the area of the birds into the breeding period from the beginning of this time on the other hand, when the number exceeds a threshold, can be considered the end of the breeding bird.

【技术实现步骤摘要】
一种辅助鸟类繁殖期的物候研究的鸟类声音识别方法
本专利技术涉及鸟类声音识别
,具体是一种辅助鸟类繁殖期的物候研究的鸟类声音识别方法。
技术介绍
生物学上,鸟类的叫声分为叫声(birdcall),鸣声(birdsong)。其中,鸣声(birdsong)指的是鸟类在繁殖期发出的叫声。同一种鸟类的鸣声模式非常固定。而不同鸟类的鸣声区别往往很大。因此可以使用鸟类的鸣声作为识别鸟类种类的一种手段。所谓物候是研究动物与环境周期变化关系研究的学科。其中一个分支是研究鸟类的繁殖期与环境周期变化的关系。而鸟类的繁殖期可以通过识别鸟类的声音获得。因此,可以通过鸟类声音识别辅助鸟类繁殖期的物候的研究。
技术实现思路
本专利技术所要解决的技术问题在于提供一种辅助鸟类繁殖期的物候研究的鸟类声音识别方法。为解决上述技术问题,采用如下技术方案:一种辅助鸟类繁殖期的物候研究的鸟类声音识别方法,其特征在于,首先读取现场的录音片段,声音中包含着若干鸟类鸣声的片段,然后识别算法会识别录音中叫声片段所属的鸟类的种类,给出一个识别的可信度,并且记录该段叫声在录音片段中的出现时间,最后结合录音的时间可以计算这种发出鸣声的鸟类的数量,也就是进入繁殖期的鸟类的数量,当某个时间以后这个数量超过一个预先设定的阈值以后,即可认为在该地区这种鸟类从这个时候开始进入繁殖期,反之,当数量减少超过一个阈值以后,即可认为该种鸟结束了繁殖期。识别算法的具体步骤为:1)采用半监督的非负矩阵分解用来做源分离,2)将信号通过一个低通滤波器,然后进行频率补偿;3)对声音进行分割:使用短时能量找到空白到叫声的转换点,首先算出录音的短时能量:然后根据阈值找出声音片段;4)特征提取:首先将声音片段加上重叠的窗,每一窗成为一帧,针对每个窗内的值提取时域特征和频域特征,大部分频域特征是基于短时傅里叶变换(STFT)的,然后把时域特征和频域特征合成一个向量,作为这一帧的特征向量;5)降维和降噪:使用PCA作为降维的手段;6)采用隐式马尔科夫链为每一种鸟类鸣声建立数学模型,首先采用segmentalkmeans进行模型初始化,然后使用前向-后向算法(forward-backwardalgorithm)对HMM进行训练,HMM模型建立好了以后,对于新的需要处理的录音,进行源分离,预处理,分割,特征提取,PCA,然后将得到的特征序列与每一个训练好的HMM进行比对。即采用维特比算法(ViterbiAlgorithm)进行解码,得到可信度。选取可信度最大的那个模型作为识别结果。附图说明图1为本专利技术一技术线路示意图具体实施方式下面结合附图对本专利技术作进一步详细说明。首先读取现场的录音片段,声音中包含着若干鸟类鸣声的片段,然后识别算法会识别录音中叫声片段所属的鸟类的种类,给出一个识别的可信度,并且记录该段叫声在录音片段中的出现时间,最后结合录音的时间可以计算这种发出鸣声的鸟类的数量,也就是进入繁殖期的鸟类的数量,当某个时间以后这个数量超过一个预先设定的阈值以后,即可认为在该地区这种鸟类从这个时候开始进入繁殖期,反之,当数量减少超过一个阈值以后,即可认为该种鸟结束了繁殖期。识别算法具体的步骤为:1)semi-supervisedNMFSemi-supervisedNMF:用来做源分离(sourceseparation)。所谓源分离是指录音机录的声音是多种声音的混合,在一些时候会有重叠。源分离是用来把不同声音分开的技术。NMF的全称是non-negativematrixfactorization,即非负矩阵分解。是现在做源分离效果最好的方法。它可以把声音分解成不同基(base)加权的形式。一组基和相应的加权可以作为源分离得到的一个结果。Semi-supervisedNMF是指首先用某些已知特定类别的数据训练,得到与这个类别相对应的基,然后用这组基加上另外一组初始向量对想要处理的数据使用NMF算法。事先训练好的已知类别的基和加权用来得到分离的结果,对这些结果进行后续的处理。使用Semi-supervisedNMF可以得到很好的分离效果,另外可以有效地抑制噪声。这种方法在某些环境比其他的降噪方法效果要好。因为传统的降噪手段需要对噪声的性质有了解。但是噪声的产生条件是非常不确定的。因此无法准确预先描述噪声的性质。这样传统降噪的手段效果就不是很好。但是基于semi-supervisedNMF的方法可以不用事先知道噪声的性质。因此,基于semi-supervisedNMF的方法的降噪效果要更好。2)预处理预处理主要做两部分工作。首先将信号通过一个低通滤波器。然后进行频率补偿。3)分割录音很长而且包含空白和叫声。因此需要首先把空白的部分去除,只留下有叫声的部分。因此需要对声音进行分割(segmentation)。使用短时能量(short-termenergy)找到空白到叫声的转换点(endpoint)。首先算出录音的短时能量,然后根据阈值找出声音片段。4)特征提取对于得到的每一段叫声,需要提取他们的特征。首先将声音片段加上重叠的窗,每一窗称为一帧,针对每个窗内的值提取时域特征和频域特征。大部分频域特征是基于短时傅里叶变换(STFT)的。然后把时域特征和频域特征合成一个向量,作为这一帧的特征向量。时域特征有:zerocrossingrate,Shorttimeenergy,entropyofenergy频域特征有:MFCC,spectralcentroid,Spectralspread,Spectralentropy,Spectralflux,Spectralrolloff5)PCA由于得到的特征向量维度较高,直接运算的话运算量非常大,而且会有一些噪声。因此需要对数据进行降维,这里使用PCA作为降维的手段。PCA全称是principalcomponentanalysis,主成分分析。PCA是一种有效的数据降维手段,可以降低数据维度,减少运算量。并且可以降低很多噪声。从而提升系统性能。6)HMMHMM的全称是隐式马尔科夫链(HiddenMarkovModel)。是一种非常著名的用来时序建模的数学模型。相比于其他方法,HMM的识别效率更高,鲁棒性更好。对于每种鸟类的鸣声建立一个HMM。首先采用segmentalkmeans进行模型初始化,然后使用前向-后向算法(forward-backwardalgorithm)对HMM进行训练。训练结束以后,对于新的经过PCA处理后需要识别的特征向量,采用维特比算法(viterbialgorithm)对每一个特征向量进行解码。维特比算法会得到一个概率,可以根据需要选择概率最大的若干的HMM对应的种类作为结果。HMM输出鸟类的种类和可信度。上述实施例仅例示性说明本专利技术的原理及其功效,以及部分运用的实施例,对于本领域的普通技术人员来说,在不脱离本专利技术创造构思的前提下,还可以做出若干变形和改进,这些都属于本专利技术的保护范围。本文档来自技高网...
一种辅助鸟类繁殖期的物候研究的鸟类声音识别方法

【技术保护点】
一种辅助鸟类繁殖期的物候研究的鸟类声音识别方法,其特征在于,首先读取现场的录音片段,声音中包含着若干鸟类鸣声的片段,然后识别算法会识别录音中叫声片段所属的鸟类的种类,给出一个识别的可信度,并且记录下这段声音的实际录制日期,最后结合算法的识别结果计算出该地区全部录音中这种发出鸣声的鸟类的数量,也就是进入繁殖期的鸟类的数量,当某个时间以后这个数量超过一个预先设定的阈值以后,即可认为在该地区这种鸟类从这个时候开始进入繁殖期,反之,当数量减少超过一个阈值以后,即可认为该种鸟结束了繁殖期。

【技术特征摘要】
1.一种辅助鸟类繁殖期的物候研究的鸟类声音识别方法,其特征在于,首先读取现场的录音片段,声音中包含着若干鸟类鸣声的片段,然后识别算法会识别录音中叫声片段所属的鸟类的种类,给出一个识别的可信度,并且记录下这段声音的实际录制日期,最后结合算法的识别结果计算出该地区全部录音中这种发出鸣声的鸟类的数量,也就是进入繁殖期的鸟类的数量,当某个时间以后这个数量超过一个预先设定的阈值以后,即可认为在该地区这种鸟类从这个时候开始进入繁殖期,反之,当数量减少超过一个阈值以后,即可认为该种鸟结束了繁殖期。2.根据权利要求1所述的辅助鸟类繁殖期的物候研究的鸟类声音识别方法,其特征在于,识别算法的具体步骤为:1)采用半监督的非负矩阵分解用来做源分离,2)将信号通过一个低通滤波器,然后进行频率补偿;3)对声音进行分割:使用短时能量找到空白到叫声的转换点,首先算出录...

【专利技术属性】
技术研发人员:刘丰李晟申小莉
申请(专利权)人:北京市计算中心
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1