音频数据处理方法、设备及存储介质技术

技术编号：37577643 阅读：30 留言：0更新日期：2023-05-15 07:53

本申请涉及一种音频数据处理方法、设备及存储介质，属于音频处理技术领域，该方法包括：对待处理的音频文件进行分块，得到当前的文件块；将当前的文件块中的音频帧逐帧依次加载至预先申请的第一内存空间；对第一内存空间中的当前一帧音频帧进行预处理；申请第二内存空间；对预处理后的音频数据进行特征提取，将特征数据存储至第二内存空间；基于第二内存空间中的特征数据，显示当前一帧音频帧的特征信息；在当前的文件块中的音频帧未加载完成的情况下，清空第一内存空间和第二内存空间，对下一帧音频帧进行处理直至音频文件中的各帧音频帧均处理完成时停止；可以减少数据处理过程中的内存消耗，降低对设备的内存要求。降低对设备的内存要求。降低对设备的内存要求。

全部详细技术资料下载

【技术实现步骤摘要】
音频数据处理方法、设备及存储介质

[0001]本申请涉及一种音频数据处理方法、设备及存储介质，属于音频处理

技术介绍

[0002]声纹鉴定又称语声鉴定，是指对有声言语进行个人识别的专门技术。通过声纹鉴定技术可以将目标人物的语音数据转换成条带状或曲线形语谱图(即声纹)，之后相关鉴定专家可以根据语谱图所反映的音频、音强与时间等声纹特征信息，就目标人物的身份做出鉴别与判断。
[0003]在声纹鉴定场景中，需要从音频数据中提取出特征数据以供相关鉴定专家进行分析。传统的特征数据提取过程包括以下两种实现方式：
[0004](1)采用C++语言对语音数据的处理，通过winform研发桌面端应用。
[0005](2)采用C++语言对语音数据的处理，将处理数据转换到web前端。
[0006]无论哪种方式，采用C++语言对音频的处理需要将音频文件加载至内存，在内存中进行信号处理计算，从而提升计算的性能。但是，若音频文件很大，且桌面端应用同时打开的窗口较多，而每个窗口还要额外占据内存存储计算得到的特征数据...

【技术保护点】

【技术特征摘要】
1.一种音频数据处理方法，其特征在于，所述方法包括：对待处理的音频文件进行分块，得到当前的文件块；根据预设的分帧策略，将所述当前的文件块中的音频帧逐帧依次加载至预先申请的第一内存空间；对所述第一内存空间中的当前一帧音频帧进行预处理，得到预处理后的音频数据；申请所述预处理后的音频数据对应的特征数据的第二内存空间；对所述预处理后的音频数据进行特征提取，得到所述当前的音频帧对应的特征数据；将所述特征数据存储至所述第二内存空间；基于所述第二内存空间中的特征数据，显示所述当前一帧音频帧的特征信息；在所述当前的文件块中的音频帧未加载完成的情况下，清空所述第一内存空间和所述第二内存空间，对下一帧音频帧触发执行所述根据预设的分帧策略，将所述当前的文件块中的音频帧逐帧依次加载至预先申请的第一内存空间的步骤，直至所述音频文件中的各帧音频帧均处理完成时停止。2.根据权利要求1所述的方法，其特征在于，所述对待处理的音频文件进行分块，得到当前的文件块，包括：通过文件系统模块以文件流的方式从所述音频文件中读取预设大小的音频数据；将所述预设大小的音频数据加载至内存，得到所述当前的文件块。3.根据权利要求2所述的方法，其特征在于，在所述当前的文件块中的音频帧加载完成的情况下，所述方法还包括：确定所述音频文件是否读取完成；在未读取完成的情况下，对于所述音频文件中未读取的数据，再次触发执行所述通过文件系统模块以文件流的方式从所述音频文件中读取预设大小的音频数据；将所述预设大小的音频数据加载至内存，得到所述当前的文件块的步骤，以对再次得到的当前的文件块进行处理。4.根据权利要求1所述的方法，其特征在于，所述特征数据包括FFT变换后得到的值，相应地，所述申请所述预处理后的音频数据对应的特征数据的第二内存空间，包括：确定所述当前一帧音频帧进行...

【专利技术属性】
技术研发人员：姚智慧，
申请(专利权)人：思必驰科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人