【技术实现步骤摘要】
基于二值多频带能量分布的低信噪比声音事件检测方法
本专利技术属于声音事件检测(Soundeventdetection,SED)领域,尤其涉及一种基于二值多频带能量分布的低信噪比声音事件检测方法。
技术介绍
声音事件检测(Soundeventdetection,SED)是将一个短的声音片段的音频内容分配到一组预先训练类之一中的任务。近20年来,声音事件检测的研究一直是声学分析领域的研究热点。声音事件检测已应用于声学监测,生物声学监测,环境声音,情境感知辅助机器人,音乐流派分类和多媒体存档等领域。当前,对于声音事件的分类与检测的研究,可以归纳为特征表示、基于深度学习的声音事件分类与检测、和多音声音事件检测等三个方面。关于特征表示,主要包括音频特征常规表示(R.Grzeszick,A.Plinge,andG.A.Fink,“Bag-of-featuresmethodsforacousticeventdetectionandclassification,”IEEE/ACMTrans.Audio,Speech,Lang.Pro ...
【技术保护点】
1.一种基于二值多频带能量分布的低信噪比声音事件检测方法,其特征在于,包括以下步骤:/n步骤S1:将声音信号y(t)通过gammatone滤波器组滤波,得到y
【技术特征摘要】
1.一种基于二值多频带能量分布的低信噪比声音事件检测方法,其特征在于,包括以下步骤:
步骤S1:将声音信号y(t)通过gammatone滤波器组滤波,得到yf[t];对yf[t]取对数,形成相应的gammatone谱图Sg(f,t);
步骤S2:对每个声音信号的能量谱进行归一化处理,得到归一化后的能量谱G(f,t);
步骤S3:对G(f,t)的多频带能量分布情况进行统计,得到MBPD图M(f,b);
步骤S4:对MBPD图M(f,b)进行二值化处理得到BMBPD图MR(f,b);
步骤S5:对BMBPD图MR(f,b)进行分块,并对子块进行DCT;
步骤S6:对DCT系数进行Zigzag扫描,获得DCT系数的1维排列,取前m个DCT系数作为BMBPD-DCTZ;
步骤S7:采用BMBPD-DCTZ作为特征,以RF作为分类器,对BMBPD-DCTZ进行分类和/或识别。
2.根据权利要求1所述的基于二值多频带能量分布的低信噪比声音事件检测方法,其特征在于:
在步骤S1中,
Sg(f,t)=lg|yf[t]|(1);
其中,f表示gammatone滤波器的中心频率,t表示帧索引;
在步骤S2中,
3.根据权利要求2所述的基于二值多频带能量分布的低信噪比声音事件检测方法,其特征在于:
在步骤S3中,设G(f,t)共有B个能量等级,采用基于统计的非参数法,对每个频率子带f的能量元素进行概率密度统计,得到各个频率子带的各个能量等级的概率分布M(f,b):
其中,W为声音信号的帧数,M(f,b)...
【专利技术属性】
技术研发人员:李应,吴灵菲,王庆,池哲坚,
申请(专利权)人:福州大学,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。