一种环境声音分类分析方法、装置和介质制造方法及图纸

技术编号:34470672 阅读:22 留言:0更新日期:2022-08-10 08:44
本申请公开了一种环境声音分类分析方法、装置和介质,其中的方法包括:对语音训练数据进行数据增强;进行数据预处理并对环境声音进行特征提取,得到特征向量;采用深度CNN网络对所述特征向量进行模型训练,获得所述环境声音的多分类模型并输出。本申请采用了数据增强的方法,通过实验表明其训练效果相比没有数据增强有了较大提升,提高了系统的实用价值。提高了系统的实用价值。提高了系统的实用价值。

【技术实现步骤摘要】
一种环境声音分类分析方法、装置和介质


[0001]本申请涉及声音分类领域,尤其是一种环境声音分类分析方法、装置和介质。

技术介绍

[0002]环境声音分类的使用任务能够应用于分类不同的乐器、机器人导航、医疗或医疗问题、客户或买家提醒、犯罪警报系统、语音活动识别、基于音频的灾难识别、环境监测等。声音分类可以参与到许多应用中,这表明了它的重要性。声音的分类是为了识别小的音频剪辑或录音的声音类别。对从音频信号中得到的接收到的信息进行了详细的分析。认识到周围声音的环境并立即采取行动以降低风险是非常重要的。
[0003]相关技术采用的环境声音分类技术多为通过提取环境声音的mfcc及机器学习分类方法实现,这种方法较为简单,并且由于环境声音的噪音较多,对环境声音分类分析的精确度较低。
[0004]因此,相关技术存在的上述技术问题亟待解决。

技术实现思路

[0005]本申请旨在解决相关技术中的技术问题之一。为此,本申请实施例提供一种环境声音分类分析方法、装置和介质,能够较为准确地对环境声音进行分类和分析。r/>[0006]根本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种环境声音分类分析方法,其特征在于,所述方法包括:对语音训练数据进行数据增强;进行数据预处理并对环境声音进行特征提取,得到特征向量;采用深度CNN网络对所述特征向量进行模型训练,获得所述环境声音的多分类模型并输出。2.根据权利要求1所述的一种环境声音分类分析方法,其特征在于,所述对语音训练数据进行数据增强,至少包括:移动正音高:对所述环境声音的数据集中每个音频信号的音高都增加一个正因子;移动负音高:对所述环境声音的数据集中每个音频信号的音高都增加一个负因子;静音修剪:修剪音频剪辑的静音部分,只保留包含声音的部分;快速拉伸时间:将数据集的每个声音剪辑的时间拉伸到原来的2倍;缓慢拉伸时间:将数据集的每个声音剪辑的时间拉伸到原来的0.7倍;添加白噪声:在所述环境声音的数据集中添加白噪声。3.根据权利要求1所述的一种环境声音分类分析方法,其特征在于,所述数据预处理包括增加端点检测和去静音功能。4.根据权利要求1所述的一种环境声音分类分析方法,其特征在于,所述对环境声音进行特征提取,包括:采用Log

MEL特征提取方法对环境声音进行特征提取。5.根据权利要求4所述的一种环境声音分类分析方法,其特征在于,采用Log

MEL特征提取方法对环境声音进行特征提取后,所述方法还包括:得到...

【专利技术属性】
技术研发人员:刘立峰宋卫华冯志峰母健康王文重张建军
申请(专利权)人:珠海高凌信息科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1