【技术实现步骤摘要】
一种环境声音分类分析方法、装置和介质
[0001]本申请涉及声音分类领域,尤其是一种环境声音分类分析方法、装置和介质。
技术介绍
[0002]环境声音分类的使用任务能够应用于分类不同的乐器、机器人导航、医疗或医疗问题、客户或买家提醒、犯罪警报系统、语音活动识别、基于音频的灾难识别、环境监测等。声音分类可以参与到许多应用中,这表明了它的重要性。声音的分类是为了识别小的音频剪辑或录音的声音类别。对从音频信号中得到的接收到的信息进行了详细的分析。认识到周围声音的环境并立即采取行动以降低风险是非常重要的。
[0003]相关技术采用的环境声音分类技术多为通过提取环境声音的mfcc及机器学习分类方法实现,这种方法较为简单,并且由于环境声音的噪音较多,对环境声音分类分析的精确度较低。
[0004]因此,相关技术存在的上述技术问题亟待解决。
技术实现思路
[0005]本申请旨在解决相关技术中的技术问题之一。为此,本申请实施例提供一种环境声音分类分析方法、装置和介质,能够较为准确地对环境声音进行分类和分析。r/>[0006]根本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种环境声音分类分析方法,其特征在于,所述方法包括:对语音训练数据进行数据增强;进行数据预处理并对环境声音进行特征提取,得到特征向量;采用深度CNN网络对所述特征向量进行模型训练,获得所述环境声音的多分类模型并输出。2.根据权利要求1所述的一种环境声音分类分析方法,其特征在于,所述对语音训练数据进行数据增强,至少包括:移动正音高:对所述环境声音的数据集中每个音频信号的音高都增加一个正因子;移动负音高:对所述环境声音的数据集中每个音频信号的音高都增加一个负因子;静音修剪:修剪音频剪辑的静音部分,只保留包含声音的部分;快速拉伸时间:将数据集的每个声音剪辑的时间拉伸到原来的2倍;缓慢拉伸时间:将数据集的每个声音剪辑的时间拉伸到原来的0.7倍;添加白噪声:在所述环境声音的数据集中添加白噪声。3.根据权利要求1所述的一种环境声音分类分析方法,其特征在于,所述数据预处理包括增加端点检测和去静音功能。4.根据权利要求1所述的一种环境声音分类分析方法,其特征在于,所述对环境声音进行特征提取,包括:采用Log
‑
MEL特征提取方法对环境声音进行特征提取。5.根据权利要求4所述的一种环境声音分类分析方法,其特征在于,采用Log
‑
MEL特征提取方法对环境声音进行特征提取后,所述方法还包括:得到...
【专利技术属性】
技术研发人员:刘立峰,宋卫华,冯志峰,母健康,王文重,张建军,
申请(专利权)人:珠海高凌信息科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。