当前位置: 首页 > 专利查询>福州大学专利>正文

区域生态环境音频数据分类方法技术

技术编号:2917052 阅读:219 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及音频数据检索、分类和处理技术,为区域生态环境音频数据的分析、索引、搜索和检索提供一种高效的分类方法,包括以下步骤:1)对音频信号进行有效分段并计算分段长度;2)计算各有效分段的差分Mel频率倒谱系数矩阵;3)计算各有效分段的最大谐波分量频率成分,并建立分段长度与最大谐波分量频率成分的分布关系;4)分别确定各有效分段的分类搜索范围,并分别从数据库中搜索落入各分类搜索范围内的所有已知类型音频信号的有效分段对应的数据点;5)将各有效分段的分类参数与落入其分类搜索范围内的所有数据点的分类参数分别进行比较,根据接近程度确定各有效分段相应的可能类型;6)根据各有效分段的可能类型,最终确定待分类的音频信号的类型。

【技术实现步骤摘要】

本专利技术涉及音频数据检索、分类和处理技术,特别是一种区域生态环境音频数据分类方法
技术介绍
不同的区域、地点、年份、季节、气候以及一天中不同的时间,在生态环境中能产生不同的声音。这些声音在一定程度上反映出自然界中各种生物生存及活动的情况,同时也与人类的生活环境密切相关。研究区域生态环境音频数据的分类技术,对于生态环境音频数据的辨识、索引和检索方法及关键技术,确定区域生态环境音频与地域、地点、季节、气候条件及时间的关系,分析和研究生态环境、预测生态环境的变化、了解各种生物生存及活动规律具有重要意义。近年来,对于生态及生活环境音频数据的分类、辨识方面的研究及应用包括:利用对环境机械声音的独立分量分析,用阶乘H M M(ICA-FHMM)进行机械故障辨识(Li,He,Chu,Han,& Hao,2006);从声音环境中,推断出生态环境中可能存在的活动类型及活动的参与者(Smith,Ma,& Ryan,2006);利用集成的自适应学习机制和分等级分类模型的HMM,设计声音环境分类器(Ma,Milner,& Smith,2006);用动物声音的Mel频率倒谱系数和线性判别式分析来自动辨识动物的类型(Lee,Chou,Han,& Huang,2006);采用似然模型,把低级音频特征和运动特征与预定义的音频类型和运动类型,通过HMM模型检索棒球比赛的精彩场面(Cheng,& Hsu,2006);用HMM和MFCC进行大象的发音分类和发声者辨识(Clemins,Johnson,Leong,&Savage,2005);用HMM和MFCC进行浴室声音事件的分类,实现自动浴室活动监控系统(Chen,Kam,Zhang,Liu,& Shue,2005);把ICA时间扩展的通用音频模型的特征抽取方法,用于厨房环境中的相关声音分类(Kraft,Malkin,Schaaf,& Waibel,2005);用独立成分分析的MFCC和基于帧的SVM,来实现家庭自动化中家庭环境声音的辨识(Wang,Lee,Wang,& Lin,2008);通过各种环境音频的傅立叶变换和小波变换来分类环境音频数据(McLachlan,Kumar,& Becker,2006)。这些研究从不同侧面揭示了生态及环境音频数据与动物、人类生活及环境的关系,同时,也预示着这些相关技术在现实中的潜在应用。然而,这些研究都未涉及区域生态环境音频数据检索与分类的内容。
技术实现思路
本专利技术的目的在于为区域生态环境音频数据的分析、索引、搜索和检索提供一种高效的分类方法。-->本专利技术的目的是通过如下的技术方案实现的:这种区域生态环境音频数据分类方法,该方法包括以下步骤:(1)对待定类型的生态环境音频信号进行有效分段,并计算各有效分段的分段长度,通过如下步骤实现:a)对音频信号进行分帧处理;b)计算每一帧的平均幅度Mi和整个音频信号的平均幅度M;c)取帧平均幅度Mi连续5帧或5帧以上高于0.67*M的一段音频信号作为一有效分段,从而将音频信号分成若干有效分段;d)记录每个有效分段中帧的数目。(2)计算各有效分段的差分Mel频率倒谱系数矩阵d-mfccm,以从中得到各有效分段的分类参数,其方法是:计算各有效分段内每个帧的Mel频率倒谱系数Mfcc,并以每个帧的Mfcc为行建立各有效分段的矩阵Mfccm,对矩阵进行一阶差分得到差分Mel频率倒谱系数矩阵d-mfccm,根据d-mfccm中各行与对应的有效分段的短时平均幅度Mi的相似程度,选出一行作为分类参数。(3)计算各有效分段的最大谐波分量频率成分,并建立各有效分段的分段长度与最大谐波分量频率成分的分布关系;计算各有效分段的最大谐波分量频率成分的方法如下:a)计算有效分段中每一帧音频信号的最大谐波分量的频率成分;b)从所述帧频率成分的最大谐波分量中取极大值,取与极大值对应的频率成分作为该有效分段最大谐波分量的频率成分。(4)分别根据各有效分段的分段长度、最大谐波分量频率成分的上、下限确定各有效分段对应的分类搜索范围,并分别从数据库中搜索落入各分类搜索范围内的所有已知类型音频信号的有效分段对应的数据点;(5)将各有效分段的分类参数与落入其分类搜索范围内的所有数据点的分类参数分别进行比较,根据接近程度确定各有效分段相应的可能类型;(6)根据各有效分段的可能类型,最终确定待分类的音频信号的类型。本专利技术的显著特点是为区域生态环境音频数据的分析、索引、搜索和检索提供了一种高效的分类方法,不仅提高了分类效率,而且对音频信号分类的准确性高,具有很强的实用性和广阔的应用前景。附图说明图1是本专利技术实施例一个麻雀声音信号的分段过程图;-->图2是本专利技术实施例由生态音频信号产生d-mfccm分类参数的过程示意图;图3是本专利技术实施例的生态音频信号有效分段的最大谐波分量频率与d-mfccm的对应图;图4是本专利技术实施例各种生态环境音频信号有效分段长度及其最大谐波分量的频率成分分布图;图5是本专利技术实施例由一个麻雀声音的各个有效分段长度及其最大谐波分量的频率成分确定的查询范围图;图6是本专利技术实施例一个麻雀声音信号的每个有效分段需要进行d-mfccm比较的范围图;图7是本专利技术实施例待分类区域生态音频段的d-mfccm需要与已知类型的音频段的d-mfccm比较内容的示意图;图8是本专利技术实施例的流程图;图9是本专利技术实施例Mel频率与实际频率的关系图;图10是本专利技术实施例Mel三角形滤波器组的示意图。具体实施方式本专利技术的区域生态环境音频数据分类方法,该方法包括以下步骤:(1)对待定类型的生态环境音频信号进行有效分段,并计算各有效分段的分段长度,通过如下步骤实现:a)对音频信号进行分帧处理;b)计算每一帧的平均幅度Mi和整个音频信号的平均幅度M;c)取帧平均幅度Mi连续5帧或5帧以上高于0.67*M的一段音频信号作为一有效分段,从而将音频信号分成若干有效分段;d)记录每个有效分段中帧的数目。(2)计算各有效分段的差分Mel频率倒谱系数矩阵d-mfccm,以从中得到各有效分段的分类参数,其方法是:计算各有效分段内每个帧的Mel频率倒谱系数Mfcc,并以每个帧的Mfcc为行建立各有效分段的矩阵Mfccm,对矩阵进行一阶差分得到差分Mel频率倒谱系数矩阵d-mfccm,根据d-mfccm中各行与对应的有效分段的短时平均幅度Mi的相似程度,选出一行作为分类参数。(3)计算各有效分段的最大谐波分量频率成分,并建立各有效分段的分段长度与最大谐波分量频率成分的分布关系;计算各有效分段的最大谐波分量频率成分的方法如下:a)计算有效分段中每一帧音频信号的最大谐波分量的频率成分;b)从所述帧频率成分的最大谐波分量中取极大值,取与极大值对应的频率成分作为该有-->效分段最大谐波分量的频率成分。(4)分别根据各有效分段的分段长度、最大谐波分量频率成分的上、下限确定各有效分段对应的分类搜索范围,并分别从数据库中搜索落入各分类搜索范围内的所有已知类型音频信号的有效分段对应的数据点;(5)将各有效分段的分类参数与落入其分类搜索范围内的所有数据点的分类参数分别进行比较,根据接近程度确定各有效分段相应的可能类型;(6本文档来自技高网
...

【技术保护点】
一种区域生态环境音频数据分类方法,其特征在于:该方法包括以下步骤: (1)对待定类型的生态环境音频信号进行有效分段,并计算各有效分段的分段长度; (2)计算各有效分段的差分Mel频率倒谱系数矩阵d-mfccm,以从中得到各有效分段的分类参数; (3)计算各有效分段的最大谐波分量频率成分,并建立各有效分段的分段长度与最大谐波分量频率成分的分布关系; (4)分别根据各有效分段的分段长度、最大谐波分量频率成分的上、下限确定各有效分段对应的分类搜索范围,并分别从数据库中搜索落入各分类搜索范围内的所有已知类型音频信号的有效分段对应的数据点; (5)将各有效分段的分类参数与落入其分类搜索范围内的所有数据点的分类参数分别进行比较,根据接近程度确定各有效分段相应的可能类型; (6)根据各有效分段的可能类型,最终确定待分类的音频信号的类型。

【技术特征摘要】
1、一种区域生态环境音频数据分类方法,其特征在于:该方法包括以下步骤:(1)对待定类型的生态环境音频信号进行有效分段,并计算各有效分段的分段长度;(2)计算各有效分段的差分Mel频率倒谱系数矩阵d-mfccm,以从中得到各有效分段的分类参数;(3)计算各有效分段的最大谐波分量频率成分,并建立各有效分段的分段长度与最大谐波分量频率成分的分布关系;(4)分别根据各有效分段的分段长度、最大谐波分量频率成分的上、下限确定各有效分段对应的分类搜索范围,并分别从数据库中搜索落入各分类搜索范围内的所有已知类型音频信号的有效分段对应的数据点;(5)将各有效分段的分类参数与落入其分类搜索范围内的所有数据点的分类参数分别进行比较,根据接近程度确定各有效分段相应的可能类型;(6)根据各有效分段的可能类型,最终确定待分类的音频信号的类型。2、根据权利要求1所述的区域生态环境音频数据分类方法,其特征在于:步骤(1)通过以下步骤进行音频信号的有效分段及分段长度的计算:(a)对音频信号进行分帧处理;(b)计算每一帧的平均幅度Mi和整个音频信号的平均幅度M;(c)取帧平均幅...

【专利技术属性】
技术研发人员:李应
申请(专利权)人:福州大学
类型:发明
国别省市:35[中国|福建]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1