一种音频分段转码方法及装置制造方法及图纸

技术编号:38416605 阅读:9 留言:0更新日期:2023-08-07 11:19
本发明专利技术公开了一种音频分段转码方法及装置,包括:在满足第一转码约束条件T的情况下,对当前音频进行分段,得到各个段落,每个段落中包含有预设数量的ts分片,各个段落满足第二转码约束条件,第二转码约束条件保证相邻段落产生两个ts分片的重叠区,对各个段落进行转码,针对转码后的各个段落中的首个段落,丢弃尾部ts分片,中间段落丢弃头部和尾部ts分片,尾部段落丢弃头部ts分片,得到各个目标ts分片;将各个目标ts分片依据时间顺序拼接,得到目标音频。上述过程,对段落衔接处的ts分片进行了删除,避免了段落衔接处引入上述静音数据的问题,并且在码流层操作,不需要构建新的片源片段,计算复杂度低,提高了转码的执行效率。提高了转码的执行效率。提高了转码的执行效率。

【技术实现步骤摘要】
一种音频分段转码方法及装置


[0001]本专利技术涉及数据处理
,尤其涉及一种音频分段转码方法及装置。

技术介绍

[0002]有损音频编码标准如AAC、MP3、Opus是目前音频转码中使用最为广泛的编码标准,它们均使用相邻帧交叠的时频变换(overlapping Time/Frequency transform)技术,因此会在每个编码文件起始处和结尾处引入额外静音段。在分布式转码系统中对音频进行分段转码,若将分段转码后的各个片段直接拼接为成品文件,将在成品文件的段落衔接处引入上述静音数据,从而表现为轻微顿音瑕疵,影响听众的连续观感体验。
[0003]目前大多数分布式转码系统对音频采用整段转码从而有意或无意规避了这一问题。然而对高码率、长时长片源采用音频整片转码将影响任务的执行效率,成为分布式转码系统的瓶颈。

技术实现思路

[0004]有鉴于此,本专利技术提供了一种音频分段转码方法及装置,用以解决现有目前大多数分布式转码系统对音频采用整段转码,然而对高码率、长时长片源采用音频整片转码将影响任务的执行效率,成为分布式转码系统的瓶颈的问题。具体方案如下:
[0005]一种音频分段转码方法,包括:
[0006]确定与当前音频关联的第一转码约束条件T,其中,所述第一转码约束条件T中所述当前音频的ts分片时长为所述第一转码约束条件T的整数倍,所述当前音频的段落起始时间、段落转码时长为所述ts分片时长的整数倍;
[0007]在满足所述第一转码约束条件T的情况下,对所述当前音频进行分段,得到各个段落,其中,每个段落中包含有预设数量的ts分片,所述各个段落满足第二转码约束条件,所述第二转码约束条件保证相邻段落产生两个ts分片的重叠区,所述各个段落为HLS

TS容器格式;
[0008]对所述各个段落进行转码,针对转码后的各个段落中的首个段落,丢弃尾部ts分片,中间段落丢弃头部和尾部ts分片,尾部段落丢弃头部ts分片,得到各个目标ts分片;
[0009]将所述各个目标ts分片依据时间顺序拼接,得到目标音频。
[0010]上述的方法,可选的,所述确定与当前音频关联的第一转码约束条件T,包括:
[0011]获取所述当前音频的编码帧长、转码采样率;
[0012]设定转码采样率/10
n
为正整数,基于所述转码采样率确定参数n的取值,n为正整数;
[0013]基于T=编码帧长/10
n
,确定所述第一转码约束条件T的各个备选值;
[0014]在所述各个备选值中选择任意一个小于所述当前音频的片源时长的备选值作为第一转码约束条件T,其中,在所述第一转码约束条件T中所述ts分片时长为所述第一转码约束条件T的整数倍,所述当前音频的段落起始时间、所述段落转码时长为所述ts分片时长
的整数倍。
[0015]上述的方法,可选的,还包括:设置所述段落转码时长,
[0016]所述设置所述段落转码时长,包括:
[0017]获取所述当前音频的片源时长和划分的段落数量,基于所述当前音频的片源时长和所述段落数量对所述当前音频进行划分,得到初始段落转码时长;
[0018]基于所述ts分片时长对所述初始段落转码时长进行调整,以令所述段落转码时长设为所述ts分片时长的整数倍。
[0019]上述的方法,可选的,所述对所述当前音频进行分段,得到各个段落,包括:
[0020]基于所述段落转码时长确定每个段落的起始时间;
[0021]基于所述起始时间和所述段落转码时长对所述当前音频进行分段,将得到的每个分段基于所述ts分片时长进行分片,得到各个段落。
[0022]上述的方法,可选的,所述基于所述段落转码时长确定每个段落的起始时间,包括:
[0023]确定针对首个段落的段落起始时间为0;
[0024]确定针对其余段落的段落起始时间依次为前一段落的结束时间减去2倍的所述ts分片时长。
[0025]上述的方法,可选的,所述对所述各个段落进行转码,针对转码后的各个段落中的首个段落,丢弃尾部ts分片,中间段落丢弃头部和尾部ts分片,尾部段落丢弃头部ts分片,得到各个目标ts分片,包括:
[0026]对所述各个段落基于预设转码标准进行转码,得到转码后的各个段落;
[0027]识别所述转码后各个段落中的首个段落、中间段落和尾部段落;
[0028]针对所述首个段落,丢弃尾部ts分片,所述中间段落丢弃头部和尾部ts分片,所述尾部段落丢弃头部ts分片,得到各个目标ts分片。
[0029]一种音频分段转码装置,包括:
[0030]确定模块,用于确定与当前音频关联的第一转码约束条件T,其中,所述第一转码约束条件T中所述当前音频的ts分片时长为所述第一转码约束条件T的整数倍,所述当前音频的段落起始时间、段落转码时长为所述ts分片时长的整数倍;
[0031]分段模块,用于在满足所述第一转码约束条件T的情况下,对所述当前音频进行分段,得到各个段落,其中,每个段落中包含有预设数量的ts分片,所述各个段落满足第二转码约束条件,所述第二转码约束条件保证相邻段落产生两个ts分片的重叠区,所述各个段落为HLS

TS容器格式;
[0032]处理模块,用于对所述各个段落进行转码,针对转码后的各个段落中的首个段落,丢弃尾部ts分片,中间段落丢弃头部和尾部ts分片,尾部段落丢弃头部ts分片,得到各个目标ts分片;
[0033]拼接模块,用于将所述各个目标ts分片依据时间顺序拼接,得到目标音频。
[0034]上述的装置,可选的,所述确定模块包括:
[0035]获取单元,用于获取所述当前音频的编码帧长、转码采样率;
[0036]第一确定单元,用于设定转码采样率/10
n
为正整数,基于所述转码采样率确定参数n的取值,n为正整数;
[0037]第二确定单元,用于基于T=编码帧长/10
n
,确定所述第一转码约束条件T的各个备选值;
[0038]选取单元,用于在所述各个备选值中选择任意一个小于所述当前音频的片源时长的备选值作为第一转码约束条件T,其中,在所述第一转码约束条件T中所述ts分片时长为所述第一转码约束条件T的整数倍,所述当前音频的段落起始时间、所述段落转码时长为所述ts分片时长的整数倍。
[0039]上述的装置,可选的,所述确定模块还包括:设置单元,其中,所述设置单元包括:
[0040]获取子单元,用于获取所述当前音频的片源时长和划分的段落数量,基于所述当前音频的片源时长和所述段落数量对所述当前音频进行划分,得到初始段落转码时长;
[0041]调整子单元,用于基于所述ts分片时长对所述初始段落转码时长进行调整,以令所述段落转码时长设为所述ts分片时长的整数倍。
[0042]上述的装置,可选的,所述处理模块包括:
[0043]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频分段转码方法,其特征在于,包括:确定与当前音频关联的第一转码约束条件T,其中,所述第一转码约束条件T中所述当前音频的ts分片时长为所述第一转码约束条件T的整数倍,所述当前音频的段落起始时间、段落转码时长为所述ts分片时长的整数倍;在满足所述第一转码约束条件T的情况下,对所述当前音频进行分段,得到各个段落,其中,每个段落中包含有预设数量的ts分片,所述各个段落满足第二转码约束条件,所述第二转码约束条件保证相邻段落产生两个ts分片的重叠区,所述各个段落为HLS

TS容器格式;对所述各个段落进行转码,针对转码后的各个段落中的首个段落,丢弃尾部ts分片,中间段落丢弃头部和尾部ts分片,尾部段落丢弃头部ts分片,得到各个目标ts分片;将所述各个目标ts分片依据时间顺序拼接,得到目标音频。2.根据权利要求1所述的方法,其特征在于,所述确定与当前音频关联的第一转码约束条件T,包括:获取所述当前音频的编码帧长、转码采样率;设定转码采样率/10
n
为正整数,基于所述转码采样率确定参数n的取值,n为正整数;基于所述转码采样率确定参数n的取值,其中,转码采样率/10
n
为正整数;基于T=编码帧长/10
n
,确定所述第一转码约束条件T的各个备选值,;在所述各个备选值中选择任意一个小于所述当前音频的片源时长的备选值作为第一转码约束条件T,其中,在所述第一转码约束条件T中所述ts分片时长为所述第一转码约束条件T的整数倍,所述当前音频的段落起始时间、所述段落转码时长为所述ts分片时长的整数倍。3.根据权利要求2所述的方法,其特征在于,还包括:设置所述段落转码时长,所述设置所述段落转码时长,包括:获取所述当前音频的片源时长和划分的段落数量,基于所述当前音频的片源时长和所述段落数量对所述当前音频进行划分,得到初始段落转码时长;基于所述ts分片时长对所述初始段落转码时长进行调整,以令所述段落转码时长设为所述ts分片时长的整数倍。4.根据权利要求3所述的方法,其特征在于,所述对所述当前音频进行分段,得到各个段落,包括:基于所述段落转码时长确定每个段落的起始时间;基于所述起始时间和所述段落转码时长对所述当前音频进行分段,将得到的每个分段基于所述ts分片时长进行分片,得到各个段落。5.根据权利要求4所述的方法,其特征在于,所述基于所述段落转码时长确定每个段落的起始时间,包括:确定针对首个段落的段落起始时间为0;确定针对其余段落的段落起始时间依次为前一段落的结束时间减去2倍的所述ts分片时长。6.根据权利要求1所述的方法,其特征在于,所述对所述各个段落进行转码,针对转码后的各个段落中的首个段落,丢弃尾部ts分片,中间段落丢弃头部和尾部ts分片,尾部段落
丢弃头部...

【专利技术属性】
技术研发人员:罗准吴坚强
申请(专利权)人:湖南快乐阳光互动娱乐传媒有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1