一种基于ffmpeg及sox的音频文件格式统一方法及装置制造方法及图纸

技术编号：28837227 阅读：14 留言：0更新日期：2021-06-11 23:34

本发明专利技术涉及一种基于ffmpeg及sox的音频文件格式统一方法及装置，包括以下步骤，（1）输入初始音频文件；（2）获取并识别初始音频文件格式；（3）通过sox工具或ffmpeg工具进行转换得到标准wav音频文件。针对不同格式的音频文件例如mp3,aac,flag,amr,adpcm编码的wav文件、ogg格式音频和vox格式音频的初始音频使用sox工具或ffmpeg工具进行格式转化，得到标准wav文件，采用java的javax.sound.sampled.AudioSystem类对标准wav进行读取，最终得到标准wav格式音频文件，以便后续对音频进行质检等后续业务处理，增加音频识别及质检的准确性，减轻客户负担。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于ffmpeg及sox的音频文件格式统一方法及装置
本专利技术涉及音频检测
，具体为一种基于ffmpeg及sox的音频文件格式统一方法及装置。
技术介绍
音频格式是指要在计算机内播放或是处理音频文件，是对声音文件进行数、模转换的过程，目前多为PCM（脉冲编码调制）语音数据，而常见的音频格式又分为MP3、Ogg、AMR、FLAC、AIFF等格式，而作为微软公司开发的最为常见的音频格式之一的WAV格式是一种标准数字音频文件，支持MSADPCM、CCITTALAW等多种压缩算法，能够记录各种单声道或立体声的声音信息，并且可以保证声音不失真，真实记录自然声波形，基本无数据压缩。由于WAV支持多种音频数字、取样音频和声道，标准格式化的WAV文件与CD格式一样，声音文件质量与CD相差无几，因此在对音频检测的过程中，尝尝需要用到WAV格式的音频进行检测，以保证检测的准确性。但是由于业务处理中，要求客户独自提供标准的wav音频文件，从而解析出PCM音频流，对客户的要求过高，对于只能提供非标准wav音频文件的客户，又无法满足质检等业务处理需求，因此本专利技术提出一种基于ffmpeg及sox的音频文件格式统一方法，方便客户进行格式转换操作以便进行后期的音频检测。
技术实现思路
针对现有方案的不足，本专利技术公开了一种基于ffmpeg及sox的音频文件格式统一方法及装置。本专利技术技术方案是：一种基于ffmpeg及sox的音频文件格式统一方法，包括如下步骤：（1）输入初始音频...

【技术保护点】
1.一种基于ffmpeg及sox的音频文件格式统一方法，其特征在于：其包括以下步骤：/n（1）输入初始音频文件；/n（2）获取并识别初始音频文件格式；/n（3）通过sox工具或ffmpeg工具进行转换得到标准wav音频文件。/n

【技术特征摘要】
1.一种基于ffmpeg及sox的音频文件格式统一方法，其特征在于：其包括以下步骤：
（1）输入初始音频文件；
（2）获取并识别初始音频文件格式；
（3）通过sox工具或ffmpeg工具进行转换得到标准wav音频文件。

2.根据权利要求1所述的基于ffmpeg及sox的音频文件格式统一方法，其特征在于：输入的初始音频格式为mp3格式，aac格式，flag格式，amr格式，adpcm编码或非pcm编码的wav格式，ogg格式，vox格式中的一种。

3.根据权利要求1所述的基于ffmpeg及sox的音频文件格式统一方法，其特征在于：识别初始音频格式过程中，若音频为wav格式音频，通过音频读取工具进行读取；判断是否为标准wav格式音频。

4.根据权利要求1所述的基于ffmpeg及sox的音频文件格式统一方法，其特征在于：识别初始音频格式过程中，若音频为vox格式音频，通过sox工具进行转换得到标准wav音频文件。

5.根据权利要求1所述的基于...

【专利技术属性】
技术研发人员：董金杰，
申请(专利权)人：浙江百应科技有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人