一种环境声音分类分析方法、装置和介质制造方法及图纸

技术编号：34470672 阅读：22 留言：0更新日期：2022-08-10 08:44

本申请公开了一种环境声音分类分析方法、装置和介质，其中的方法包括：对语音训练数据进行数据增强；进行数据预处理并对环境声音进行特征提取，得到特征向量；采用深度CNN网络对所述特征向量进行模型训练，获得所述环境声音的多分类模型并输出。本申请采用了数据增强的方法，通过实验表明其训练效果相比没有数据增强有了较大提升，提高了系统的实用价值。提高了系统的实用价值。提高了系统的实用价值。

全部详细技术资料下载

【技术实现步骤摘要】
一种环境声音分类分析方法、装置和介质

[0001]本申请涉及声音分类领域，尤其是一种环境声音分类分析方法、装置和介质。

技术介绍

[0002]环境声音分类的使用任务能够应用于分类不同的乐器、机器人导航、医疗或医疗问题、客户或买家提醒、犯罪警报系统、语音活动识别、基于音频的灾难识别、环境监测等。声音分类可以参与到许多应用中，这表明了它的重要性。声音的分类是为了识别小的音频剪辑或录音的声音类别。对从音频信号中得到的接收到的信息进行了详细的分析。认识到周围声音的环境并立即采取行动以降低风险是非常重要的。
[0003]相关技术采用的环境声音分类技术多为通过提取环境声音的mfcc及机器学习分类方法实现，这种方法较为简单，并且由于环境声音的噪音较多，对环境声音分类分析的精确度较低。
[0004]因此，相关技术存在的上述技术问题亟待解决。

技术实现思路

[0005]本申请旨在解决相关技术中的技术问题之一。为此，本申请实施例提供一种环境声音分类分析方法、装置和介质，能够较为准确地对环境声音进行分类和分析。r/>[0006]根本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种环境声音分类分析方法，其特征在于，所述方法包括：对语音训练数据进行数据增强；进行数据预处理并对环境声音进行特征提取，得到特征向量；采用深度CNN网络对所述特征向量进行模型训练，获得所述环境声音的多分类模型并输出。2.根据权利要求1所述的一种环境声音分类分析方法，其特征在于，所述对语音训练数据进行数据增强，至少包括：移动正音高：对所述环境声音的数据集中每个音频信号的音高都增加一个正因子；移动负音高：对所述环境声音的数据集中每个音频信号的音高都增加一个负因子；静音修剪：修剪音频剪辑的静音部分，只保留包含声音的部分；快速拉伸时间：将数据集的每个声音剪辑的时间拉伸到原来的2倍；缓慢拉伸时间：将数据集的每个声音剪辑的时间拉伸到原来的0.7倍；添加白噪声：在所述环境声音的数据集中添加白噪声。3.根据权利要求1所述的一种环境声音分类分析方法，其特征在于，所述数据预处理包括增加端点检测和去静音功能。4.根据权利要求1所述的一种环境声音分类分析方法，其特征在于，所述对环境声音进行特征提取，包括：采用Log
‑
MEL特征提取方法对环境声音进行特征提取。5.根据权利要求4所述的一种环境声音分类分析方法，其特征在于，采用Log
‑
MEL特征提取方法对环境声音进行特征提取后，所述方法还包括：得到...

【专利技术属性】
技术研发人员：刘立峰，宋卫华，冯志峰，母健康，王文重，张建军，
申请(专利权)人：珠海高凌信息科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人