一种声学场景分类方法与系统技术方案

技术编号：27614496 阅读：57 留言：0更新日期：2021-03-10 10:42

本发明专利技术提供了一种声学场景分类方法，包括以下步骤：S1、将采集到的环境音频信号输入到特征提取模块，进行基于谐波冲击的梅尔对数谱特征的提取；S2、将提取到的梅尔对数谱特征输入到集成学习分类器模块，进行声学场景分类，得到声学场景分类结果；S3、将声学场景分类结果输入到综合决策模块，进行综合决策，然后做出最终的分类决定。本发明专利技术还提供了一种声学场景分类系统。本发明专利技术的有益效果是：可以可靠地、准确地识别音频中的不同场景。准确地识别音频中的不同场景。准确地识别音频中的不同场景。

全部详细技术资料下载

【技术实现步骤摘要】
一种声学场景分类方法与系统

[0001]本专利技术涉及声学场景，尤其涉及一种声学场景分类方法与系统。

技术介绍

[0002]在真实声学场景中，通常会伴随着多种声音的同时出现，也就导致了场景声音并不明显，例如，在一些音频中不仅包含人说话的声音，还包含了各种人类活动的声音如走路、骑车以及周围的环境声音，如街道上的汽车声音、沙滩的海浪声等等。此时，从复杂的音频中识别出真实的声学场景是比较困难的，目前分类方法如隐马尔可夫模型、高斯混合模型、支持向量机、K近邻算法等，虽然在数据量较小的情况下也能取得不错的分类准确率，但是当数据更加丰富、场景类型更多时，这些方法均表现不佳。因此，需要设计更好的分类模型来可靠地、准确地识别音频中的不同场景。

技术实现思路

[0003]为了解决现有技术中的问题，本专利技术提供了一种基于集成学习和谐波冲击梅尔对数特征的声学场景分类方法与系统。
[0004]本专利技术提供了一种声学场景分类方法，包括以下步骤：
[0005]S1、将采集到的环境音频信号输入到特征提取模块，进行基于谐...

【技术保护点】

【技术特征摘要】
1.一种声学场景分类方法，其特征在于，包括以下步骤：S1、将采集到的环境音频信号输入到特征提取模块，进行基于谐波冲击的梅尔对数谱特征的提取；S2、将提取到的梅尔对数谱特征输入到集成学习分类器模块，进行声学场景分类，得到声学场景分类结果；S3、将声学场景分类结果输入到综合决策模块，进行综合决策，然后做出最终的分类决定。2.根据权利要求1所述的声学场景分类方法，其特征在于：在步骤S1中，首先，将采集到的环境音频信号进行分帧加窗处理，再进行短时傅里叶变换，得到信号的频谱特征，再分离信号中的谐波源和冲击源，得到信号中的谐波源和冲击源特征后，分别提取谐波源和冲击源各自的梅尔对数谱特征，得到谐波源梅尔对数特征和冲击源梅尔对数特征。3.根据权利要求1所述的声学场景分类方法，其...

【专利技术属性】
技术研发人员：刘明，孙冲武，周彦兵，李永红，王贝，
申请(专利权)人：深圳信息职业技术学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人