一种从多路音频中提取一路音频的方法及装置制造方法及图纸

技术编号:11763621 阅读:148 留言:0更新日期:2015-07-23 13:37
本发明专利技术公开了一种从多路音频中提取一路音频的方法及装置,用于从多路音频的视频文件中提取指定一路音频,方便用户使用,也为视频进行后面的转码和播放提供支撑。所述方法包括:对具有多路音频的视频文件进行解封装,得到混合存储的多路音频数据;根据多路音频数据的存储格式及样本个数,从所述混合存储的多路音频数据中提取出指定的一路音频的所有分段音频数据;通过重采样方式,将所述指定的一路音频的所有分段音频数据合成一个音频流。该方法实现了从多路音频的视频文件中提取指定一路音频的目的。

【技术实现步骤摘要】

本专利技术涉及多媒体
,特别涉及一种从多路音频中提取一路音频的方法及 目.0
技术介绍
随着网络迅速发展,视频相关的应用越来越普及,视频文件的格式也越来越多样。目前,视频文件格式主要有FLV、DV、MP4、MKV, MOV, TS、3GP等等,其中,FLV, DV、MP4等这些格式中视频和音频是两个流,且每个都是单一流。而MKV、M0V、TS这些格式中视频和音频均可以是多个流。但是,现有的视频解码工具只能是单一流进入,单一流输出。因此,需要一种能够从多路音频的视频文件中提取指定一路音频,方便用户使用,也为视频进行后面的转码和播放提供支撑。
技术实现思路
本专利技术提供一种从多路音频中提取一路音频的方法及装置,能够从多路音频的视频文件中提取指定一路音频,方便用户使用,也为视频进行后面的转码和播放提供支撑。本专利技术提供一种从多路音频中提取一路音频的方法,包括:对具有多路音频的视频文件进行解封装,得到混合存储的多路音频数据;根据多路音频数据的存储格式及样本个数,从所述混合存储的多路音频数据中提取出指定的一路音频的所有分段音频数据;通过重采样方式,将所述指定的一路音频的所有分段音频数据合成一个音频流。本专利技术实施例的一些有益效果可以包括:从多路音频的视频文件中获取指定一路音频的分段数据,接着通过重采样方式,将该分段数据合成一个音频流。从而达到从多路音频的视频文件中提取指定一路音频目的,方便用户使用,也为视频进行后面的转码和播放提供支撑。在一个实施例中,所述根据多路音频数据的存储格式及样本个数,从所述混合存储的多路音频数据中提取出指定的一路音频的所有分段音频数据之前,还包括步骤:由所述具有多路音频的视频文件的声道layout和声道数的值与存储格式的对应关系确定所述多路音频数据的存储格式。该实施例中,多路音频的视频文件的声道layout和声道数的每一种取值对应一个音频的存储格式,在知道取值后也就知道了多路音频数据存储格式,根据该存储格式及样本个数,即可完成从多路音频数据中提取指定的一路音频的所有分段音频数据。在一个实施例中,所述多路音频数据的声道layout、声道数和样本个数的值,从所述具有多路音频的视频文件的源数据中获取。在一个实施例中,当所述具有多路音频的视频文件为WMV格式时,该多路音频的视频文件的声道layout的值取为3。在一个实施例中,所述指定的一路音频为指定语言的音频。在该实施例中,提取听众熟悉语言或用户指定的语言的音频,达到极大地提高了听众的体验感的目的。在一个实施例中,在从所述混合存储的多路音频数据中提取指定语言的音频的所有分段音频数据前,还包括步骤:根据所述具有多路音频的视频文件格式,从所述具有多路音频的视频文件的信息头中获得各路音频的语gi目息;根据获得的各路音频的语言信息,确定指定语言的音频数据是哪路音频。在该实施例中,根据具有多路音频的视频文件信息头中记录的各路音频的语言信息,提取指定语言的一路音频数据,实现从多路音频的视频文件中提取指定语言的音频目的。—种从多路音频中提取一路音频的装置,包括:视频解封装模块,接收具有多路音频的视频文件并对其进行解封装,得到混合存储的多路音频数据并输出;音频分段数据提取模块,用于根据多路音频数据的存储格式及样本个数,从所述视频解封装模块输出的混合存储的多路音频数据中提取出指定的一路音频的所有分段音频数据;合成模块,用于通过重采样方式将所述音频分段数据提取模块得到的指定的一路音频的所有分段音频数据合成一个音频流。在一个实施例中,所述的从多路音频中提取一路音频的装置,还包括:音频存储格式获取模块,用于从所述具有多路音频的视频文件的源数据中获取所述多路音频数据的声道layout、声道数和样本个数的值,并通过所述具有多路音频的视频文件的声道layout和声道数的值与存储格式的对应关系确定所述多路音频数据的存储格式,并将多路音频数据的存储格式及样本个数发送给所述音频分段数据提取模块。在一个实施例中,所述音频存储格式获取模块在所述具有多路音频的视频文件为WMV格式时,将所述多路音频的视频文件的声道的值取为3。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。【附图说明】附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:图1为本专利技术实施例中一种从多路音频中提取一路音频的方法的流程图;图2为本专利技术实施例一提供的一种从多路音频中提取一路音频的方法的流程图;图3为本专利技术实施例二提供的一种从多路音频中提取一路音频的方法的流程图;图4为本专利技术实施例中一种从多路音频中提取一路音频的装置的结构示意图之 ,图5为本专利技术实施例中一种从多路音频中提取一路音频的装置的结构示意图之--O【具体实施方式】以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。图1为本专利技术实施例中一种从多路音频中提取一路音频的方法的流程图,包括以下步骤:步骤SlOl:对具有多路音频的视频文件进行解封装,得到混合存储的多路音频数据。步骤S102:根据多路音频数据的存储格式及样本个数,从混合存储的多路音频数据中提取出指定的一路音频的所有分段音频数据。目前,解封装视频文件得到的多路音频是混合存储的。存储的对象称为Planar平面,也就是混合存储在Planar平面中。一行行存储。例如,第一段是第一路音频(或称音轨)的一段,第二段是第二路音频的一段,第三段是第三路音频的一段,多路音频混在一起。知道了存储格式,可根据该存储格式提取出指定的一路音频。根据样本个数将该段数据读出来,提取出一路音频的一段数据。步骤S103:通过重采样方式,将指定的一路音频的所有分段音频数据合成一个音频流。本专利技术实施例提供的技术方案,从多路音频的视频文件中获取指定一路音频的分段数据,接着通过重采样方式,将该分段数据合成一个音频流。从而达到从多路音频的视频文件中提取指定一路音频目的,方便用户使用,也为视频进行后面的转码和播放提供支撑。实施例一图2为本专利技术实施例一提供的一种从多路音频中提取一路音频的方法的流程图,如图2中所示,该实施例一提供的方法包括步骤S201-S204:步骤S201:对具有多路音频的视频文件进行解封装,得到混合存储的多路音频数据。步骤S202:由具有多路音频的视频文件的声道layout和声道数的值与存储格式的对应关系确定多路音频数据的存储格式。其中,由于音频声道layout和声道数的每一种取值对应一个音频的存储格式,因此在知道取值后也就知道了存储格式,其中音频声道layout和声道数一般可以从视频源(源数据,也称元数据)中得到。步骤S203:根据多路音频数据的存储格式及样本个数,从混合存储的多路音频数据中提取出指定的一路音频的所有分段音频数据。步骤S204:通过重采样方式,将指定的一路音频的所有分段音频数据合成一个音频流。本专利技术实施例一提供的技术方案,多路音频的视本文档来自技高网...

【技术保护点】
一种从多路音频中提取一路音频的方法,其特征在于,包括:对具有多路音频的视频文件进行解封装,得到混合存储的多路音频数据;根据多路音频数据的存储格式及样本个数,从所述混合存储的多路音频数据中提取出指定的一路音频的所有分段音频数据;通过重采样方式,将所述指定的一路音频的所有分段音频数据合成一个音频流。

【技术特征摘要】

【专利技术属性】
技术研发人员:彭岳松
申请(专利权)人:无锡天脉聚源传媒科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1