一种基于ffmpeg及sox的音频文件格式统一方法及装置制造方法及图纸

技术编号:28837227 阅读:14 留言:0更新日期:2021-06-11 23:34
本发明专利技术涉及一种基于ffmpeg及sox的音频文件格式统一方法及装置,包括以下步骤,(1)输入初始音频文件;(2)获取并识别初始音频文件格式;(3)通过sox工具或ffmpeg工具进行转换得到标准wav音频文件。针对不同格式的音频文件例如mp3,aac,flag,amr,adpcm编码的wav文件、ogg格式音频和vox格式音频的初始音频使用sox工具或ffmpeg工具进行格式转化,得到标准wav文件,采用java的javax.sound.sampled.AudioSystem类对标准wav进行读取,最终得到标准wav格式音频文件,以便后续对音频进行质检等后续业务处理,增加音频识别及质检的准确性,减轻客户负担。

【技术实现步骤摘要】
一种基于ffmpeg及sox的音频文件格式统一方法及装置
本专利技术涉及音频检测
,具体为一种基于ffmpeg及sox的音频文件格式统一方法及装置。
技术介绍
音频格式是指要在计算机内播放或是处理音频文件,是对声音文件进行数、模转换的过程,目前多为PCM(脉冲编码调制)语音数据,而常见的音频格式又分为MP3、Ogg、AMR、FLAC、AIFF等格式,而作为微软公司开发的最为常见的音频格式之一的WAV格式是一种标准数字音频文件,支持MSADPCM、CCITTALAW等多种压缩算法,能够记录各种单声道或立体声的声音信息,并且可以保证声音不失真,真实记录自然声波形,基本无数据压缩。由于WAV支持多种音频数字、取样音频和声道,标准格式化的WAV文件与CD格式一样,声音文件质量与CD相差无几,因此在对音频检测的过程中,尝尝需要用到WAV格式的音频进行检测,以保证检测的准确性。但是由于业务处理中,要求客户独自提供标准的wav音频文件,从而解析出PCM音频流,对客户的要求过高,对于只能提供非标准wav音频文件的客户,又无法满足质检等业务处理需求,因此本专利技术提出一种基于ffmpeg及sox的音频文件格式统一方法,方便客户进行格式转换操作以便进行后期的音频检测。
技术实现思路
针对现有方案的不足,本专利技术公开了一种基于ffmpeg及sox的音频文件格式统一方法及装置。本专利技术技术方案是:一种基于ffmpeg及sox的音频文件格式统一方法,包括如下步骤:(1)输入初始音频文件;(2)获取并识别初始音频文件格式;(3)通过sox工具或ffmpeg工具进行转换得到标准wav音频文件。优选地,输入的初始音频格式为mp3格式,aac格式,flag格式,amr格式,adpcm编码或非pcm编码的wav格式,ogg格式,vox格式中的一种。优选地,识别初始音频格式过程中,若音频为wav格式音频,通过音频读取工具进行读取;判断是否为标准wav格式音频。优选地,识别初始音频格式过程中,若音频为vox格式音频,通过sox工具进行转换得到标准wav音频文件。优选地,识别初始音频格式过程中,若音频为非vox格式音频,通过ffmpeg工具进行转换得到标准wav音频文件。优选地,所述的音频读取工具为java的javax.sound.sampled.AudioSystem类。优选地,判断为非标准wav格式音频,则通过ffmpeg工具进行转换得到标准wav音频文件。一种基于ffmpeg及sox的音频文件格式统一装置,其包括音频接收模块,用于接收初始音频文件;音频格式判断模块,用于判断初始音频文件的格式;音频读取模块,用于读取音频格式为wav的音频文件;音频转换模块,包括ffmpeg工具和sox工具,用于将非标准wav音频文件转换成标准wav音频文件。本专利技术的有益效果是:本方法可将市面上主流的mp3,aac,flag,amr,adpcm编码的wav文件、ogg格式音频和vox格式音频转换为标准的wav文件,满足进行质检等后续业务处理的需求,并且操作简单,对于无法提供标准的wav音频文件而导致无法满足业务处理需求的客户来说节省了客户寻找第三方解决问题的成本并且操作简单高效,有利于推广使用。附图说明图1为本专利技术方法流程图。具体实施方式为进一步了解本专利技术的内容,结合实施例对本专利技术作详细描述,以下实施例用于说明本专利技术,但不用来限制本专利技术的范围。如图1所示,本实施例涉及一种基于ffmpeg及sox的音频文件格式统一方法,包括如下步骤:(1)输入初始音频文件;输入的初始音频格式为mp3格式,aac格式,flag格式,amr格式,adpcm编码或非pcm编码的wav格式,ogg格式,vox格式中的一种;(2)获取并识别初始音频文件格式;若音频为wav格式音频,通过音频读取工具进行读取;如果能够正常读取,则为标准wav格式音频,如果不能读取,则为非标准wav格式音频,需要通过ffmpeg工具进行转换得到标准wav音频文件;若音频为vox格式音频,通过sox工具进行转换得到标准wav音频文件。若音频为非vox格式音频,通过ffmpeg工具进行转换得到标准wav音频文件。所述的音频读取工具为java的javax.sound.sampled.AudioSystem类。一种基于ffmpeg及sox的音频文件格式统一装置,用于上述方法,其包括音频接收模块,用于接收初始音频文件;音频格式判断模块,用于判断初始音频文件的格式;音频读取模块,用于读取音频格式为wav的音频文件;音频转换模块,包括ffmpeg工具和sox工具,用于将非标准wav音频文件转换成标准wav音频文件。以上示意性的对本专利技术及其实施方式进行了描述,该描述没有限制性,附图中所示的也只是本专利技术的实施方案,实际的结构并不局限于此。所以本领域的普通技术人员受其启示,在不脱离本专利技术创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本专利技术的保护范围。本文档来自技高网...

【技术保护点】
1.一种基于ffmpeg及sox的音频文件格式统一方法,其特征在于:其包括以下步骤:/n(1)输入初始音频文件;/n(2)获取并识别初始音频文件格式;/n(3)通过sox工具或ffmpeg工具进行转换得到标准wav音频文件。/n

【技术特征摘要】
1.一种基于ffmpeg及sox的音频文件格式统一方法,其特征在于:其包括以下步骤:
(1)输入初始音频文件;
(2)获取并识别初始音频文件格式;
(3)通过sox工具或ffmpeg工具进行转换得到标准wav音频文件。


2.根据权利要求1所述的基于ffmpeg及sox的音频文件格式统一方法,其特征在于:输入的初始音频格式为mp3格式,aac格式,flag格式,amr格式,adpcm编码或非pcm编码的wav格式,ogg格式,vox格式中的一种。


3.根据权利要求1所述的基于ffmpeg及sox的音频文件格式统一方法,其特征在于:识别初始音频格式过程中,若音频为wav格式音频,通过音频读取工具进行读取;判断是否为标准wav格式音频。


4.根据权利要求1所述的基于ffmpeg及sox的音频文件格式统一方法,其特征在于:识别初始音频格式过程中,若音频为vox格式音频,通过sox工具进行转换得到标准wav音频文件。


5.根据权利要求1所述的基于...

【专利技术属性】
技术研发人员:董金杰
申请(专利权)人:浙江百应科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1