一种音频分类方法、装置、存储介质制造方法及图纸

技术编号：40285214 阅读：5 留言：0更新日期：2024-02-07 20:38

本申请实施例提供一种音频分类方法、装置和存储介质。本申请实施例可以获取目标音频数据信号；对目标音频数据信号进行第一特征提取，得到对应的多维MFCC特征向量；通过预训练的深度神经网络模型对多维MFCC特征向量进行第二特征提取，得到对应的高层特征；通过稀疏编码算法对高层特征进行第三特征提取，得到高层特征对应的稀疏表示特征；将稀疏表示特征输入分类器，输出分类结果。由于对采集到的音频数据信号进行了两次高层维度的特征提取，得到分类效果更为准确。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及音频处理，具体而言，涉及一种音频分类方法、装置、存储介质。

技术介绍

1、随着人工智能的不断发展，人们对于智能化要求的不断提高，机器被要求具备越来越多人类所拥有的能力，其中，对周围环境的感知能力作为计算机听觉的重要组成部分也开始受到越来越多的关注。在日常的生活中，充斥着各种各样的声音，人类通过经验积累可以比较容易的判断出声音的类型，从而确定自己目前所处的环境。而机器本身并不具备这样的能力，传统的分类方法是通过在机器中集成神经网络来分类处理音频，这样的方法能够在一定程度上解决机器分类音频的问题，但是精度低，误差大。

技术实现思路

1、本申请实施例提供一种音频分类方法、装置和存储介质，可提高分类效率和准确率。

2、为解决上述的技术问题，本申请实施例提供以下技术方案：

3、本申请实施例提供了一种音频分类方法，包括：

4、获取目标音频数据信号；

5、对目标音频数据信号进行第一特征提取，得到对应的多维mfcc特征；

6、通过预训练的深度神经网络模型对多维mfcc特征进行第二特征提取，得到对应的高层特征；

7、通过稀疏编码算法对高层特征进行第三特征提取，得到高层特征对应的稀疏表示特征；

8、将稀疏表示特征输入分类器，输出分类结果。

9、一种音频分类装置，包括：

10、采集单元，用于获取目标音频数据信号；

11、第一特征提取单元，对目标音频数据信号进行第一特征提取，得到对应的多维mfcc特征向量；

12、第二特征提取单元，通过预训练的深度神经网络模型对多维mfcc特征向量进行第二特征提取，得到对应的高层特征；

13、第三特征提取单元，通过稀疏编码提取高层特征的稀疏表示特征；

14、音频分类单元，将稀疏表示特征输入分类器，输出分类结果。

15、一种网络设备，包括存储器、处理器以及存储在存储器中并可以在处理器上运行的程序，处理器执行程序以实现音频分类方法的步骤。

16、此外，本申请实施例还提供一种存储介质，存储介质存储有多条指令，指令适于处理器进行加载，以执行本申请实施例所提供的任一种音频分类方法中的步骤。

17、本申请实施例可以获取目标音频数据信号；对目标音频数据信号进行第一特征提取，得到对应的多维mfcc特征向量；通过预训练的深度神经网络模型对多维mfcc特征向量进行第二特征提取，得到对应的高层特征；通过稀疏编码算法对高层特征进行第三特征提取，得到高层特征对应的稀疏表示特征；将稀疏表示特征输入分类器，输出分类结果。由于对采集到的音频数据信号进行了两次高层维度的特征提取，得到分类效果更为准确。

本文档来自技高网...

【技术保护点】

1.一种音频分类方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，获取目标音频数据信号，包括：

3.根据权利要求2所述的方法，其特征在于，采集第一音频数据信号进行预处理，得到预处理后的音频数据信号，包括：

4.根据权利要求1所述的方法，其特征在于，对所述目标音频数据信号进行第一特征提取，得到对应的多维度MFCC特征向量，包括：

5.根据权利要求1所述的方法，其特征在于，通过预训练的深度神经网络模型对所述多维MFCC特征向量进行第二特征提取，得到对应的高层特征，包括：

6.根据权利要求1所述的方法，其特征在于，通过稀疏编码算法对所述高层特征进行第三特征提取，得到高层特征对应的稀疏表示特征，包括：

7.根据权利要求1所述的方法，其特征在于，将所述稀疏表示特征输入分类器，输出分类结果，包括：

8.一种音频分类装置，其特征在于，包括：

9.一种存储介质，其特征在于，所述存储介质存储有多条指令，所述指令适于装置处理数据，以执行权利要求1至7任一项所述音频分类方法的步骤。

...

【技术特征摘要】

1.一种音频分类方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，获取目标音频数据信号，包括：

3.根据权利要求2所述的方法，其特征在于，采集第一音频数据信号进行预处理，得到预处理后的音频数据信号，包括：

4.根据权利要求1所述的方法，其特征在于，对所述目标音频数据信号进行第一特征提取，得到对应的多维度mfcc特征向量，包括：

5.根据权利要求1所述的方法，其特征在于，通过预训练的深度神经网络模型对所述多维mfcc特征向量进行第二特征提取，得到对应的高层特征，包括：

6.根据权利要求1所述的方法，其特征在于...

【专利技术属性】
技术研发人员：白宁，
申请(专利权)人：上海游密信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人