一种多通道数字音频编码音视频同步的方法技术

技术编号:15795192 阅读:262 留言:0更新日期:2017-07-10 11:32
本发明专利技术涉及广播电视与多媒体的数字音视频处理技术领域,特别涉及一种多通道数字音频编码音视频同步的方法。包括以下步骤:并行的接收各通道音频PCM数据,将各通道音频PCM数据实时写入DDR;产生与PCM帧对应的PTS值,令PTS值分别与PCM帧,ES帧,PES帧确定对应关系;将PTS值插入PES帧的帧头。应用该技术方案可以保证多路音频编码的音视频同步,提高音频编码实时性,减小编码器成本。

【技术实现步骤摘要】
一种多通道数字音频编码音视频同步的方法
本专利技术涉及广播电视与多媒体的数字音视频处理
,特别涉及一种多通道数字音频编码音视频同步的方法。
技术介绍
在广电领域,随着视频节目数量需求的增长以及工业技术的不断提升,视频编码器输出视频节目数量随之递增,相应的音频编码器音频通道数也会成比例增长。同时人们对音频质量的要求正在不断地提高,从单声道到立体声,又在向多声道发展,最广泛采用的多声道环绕声配置是ITU-R建议的5.1声道配置。目前通常采取多通道压缩编码技术来解决多路音频的编码。如何保证多路音频被编码器稳定的接收的同时保证音视频同步,成为音频编码关键技术之一.编码器外部的AD芯片将模拟音频信号经过脉冲采样调制(PCM)转换成串行的数字音频信号,再送到编码器进行编码。通常地,PCM数据由I2S格式传输。I2S协议规定:由一个串行时钟sclk,与一个字时钟lrck指示一个PCM数据长度,同时也用于切换左右声道,以及用二进制补码表示的串行数据sdata组成。其中lrck为“1”表示正在传输的是右声道的数据,为“0”则表示正在传输的是左声道的数据。由于lrck的高低电平对应的sdata代表一个采样点的其中某一声道数据,所以lrck的频率等于采样频率。音频PCM数据具有的特点包括有:1、PCM帧的长度较长。比如MPEG算法要求一个ES帧包含1152个音频采样点的编码数据,若按双声道和16比特位宽的音频格式计算,PCM帧的长度将达到1152*2*2字节。2、音频速率远低于普通视频速率。常用的音频采样率只有48khz,意味着缓存完一个完整的音频帧需要较长的时间与存储资源。如何有效的减少存储资源,提高数据传输效率,对音频编码器的成本和性能具有很大的影响。根据MPEG-1协议,PTS是音频数据存储单元的显示时间,即音频存储单元第一个有效数据的节目显示时间。为了保证多路节目的音视频同步,需要正确的对每一路音频产生准确的与视频同步的PTS信息,将此PTS信息正确的插入与其一一对应的PES帧头中。
技术实现思路
本专利技术实施例专利技术目的在于提供一种多通道数字音频编码音视频同步的方法,应用该技术方案可以保证多路音频编码的音视频同步,提高音频编码实时性,减小编码器成本。为了实现上述专利技术目的,本专利技术的完整技术方案是:一种多通道音频编码音视频同步的方法,包括以下步骤:并行的接收各通道音频PCM数据,将各通道音频PCM数据实时写入DDR;产生与PCM帧对应的PTS值,令PTS值分别与PCM帧,ES帧,PES帧确定对应关系;将PTS值插入PES帧的帧头。优选的,并行的接收各通道音频PCM数据,将各通道音频PCM数据实时写入DDR,具体为:在各通道的输入端乒乓缓存短长度的音频PCM数据,将短长度的音频PCM数据以burst方式写入DDR。优选的,产生与PCM帧对应的PTS值,令PTS值分别与PCM帧,ES帧,PES帧确定对应关系,具体为:当第i(1~n)通道的PCM帧的第一个数据从输入端输入时,将实时产生的PTS值写入第i(1~n)通道对应的PTS寄存器;写入第i(1~n)通道对应的PTS寄存器的PTS值与第i(1~n)通道的PCM帧具有对应关系;PTS值表示该PCM帧第一个数据的显示时间戳。优选的,接收视频编码器中的PCR包,提取出PCR值,PCR值包含PCR_base值与PCR_ext值;本地PTS计数器对27Mhz时钟进行计数,本地PTS计数器分为PTS_base计数器与PTS_ext计数器;PTS_ext计数器计数范围为0到299,当PTS_ext计数300个27Mhz时钟周期后,将PTS_ext计数器归零,并且将PTS_base计数器的数值加1;PTS_base计数器与PTS_ext计数器的初始值为第一次提取的PCR_base值与PCR_ext值;当获取到PCR_base值,计算PCR_base值与本地PTS_base计数器数值的差值DIF_PTS;若DIF_PTS小于预设阈值,则本地PTS_base计数器和PTS_ext计数器的数值不进行校正,并将PTS_base值作为实时的与视频同步的PTS值;若DIF_PTS大于预设阈值,校正本地PTS_base计数器和PTS_ext计数器的数值。优选的,其中若DIF_PTS大于预设阈值,校正本地PTS_base计数器和PTS_ext计数器的数值;具体为:若DIF_PTS大于预设阈值,将PTS_base计数器数值重置为DIF_PTS的二分之一与PTS_base计数器数值的和;采用correct_cnt计数器对DIF_PTS大于预设阈值的次数进行计数;若DIF_PTS大于预设阈值则correct_cnt计数加1;若correct_cnt达到预设最大值,则将PTS_base计数器和PTS_ext计数器分别重置为PCR_base值和PCR_ext值。优选的,当DIF_PTS大于预设阈值或者correct_cnt小于预设最大值,则correct_cnt清零。优选的,在第i(1~n)通道的PCM帧的第一个数据从输入端输入时,将实时产生的PTS值写入第i(1~n)通道对应的PTS寄存器;写入第i(1~n)通道对应的PTS寄存器的PTS值与第i(1~n)通道的PCM帧具有对应关系;具体为:在第i(1~n)通道的PCM帧的数据输入端,用PCM_counter计数器对输入的PCM数据个数进行计数,当计数满一个PCM帧长度,产生PTS请求信号,锁存实时的与视频同步的PTS信息;所述PTS信息与下一个PCM帧对应,其PTS值表示下一个PCM帧的第一个数据的显示时间戳。优选的,将PCM帧进行编码转化成ES帧,PTS值与PCM帧的对应关系转化为PTS值与ES帧的对应关系;ES帧组成PES帧,PTS值与ES帧的对应关系转换为PTS值与PES帧的对应关系。优选的,将PCM帧进行编码转化成ES帧,PTS值与PCM帧的对应关系转化为PTS值与ES帧的对应关系;具体为:同时读出缓存在DDR内的第i(1~n)通道的PCM帧以及PTS寄存器内的与该PCM帧对应的PTS值。将PTS值存入通道i(1~n)的FIFO中;对第i(1~n)通道的PCM帧经过编码产生ES帧,向第通道i(1~n)的FIFO取出一次PTS值,此PTS值与ES帧具有对应关系,PTS值表示ES第一个有效音频数据对应的显示时间戳。优选的,PTS值与ES帧的对应关系转换为PTS值与PES帧的对应关系;具体为:将与第通道i(1~n)的PES帧封装的第一个ES帧对应的PTS值作为与通道i(1~n)的PES帧对应的PTS值,并将此PTS值插入通道i(1~n)中的PES帧的帧头。由上可见,应用本实施例技术方案,多路音频通道同时并行接收数据,实时的产生与视频同步的PTS信息,并行的将PTS信息植入PES帧头里。在音频数据编码的过程中,音频数据格式从PCM帧经过运算编码成ES帧,ES再组合成PES帧。本专利技术始终保持着PTS与各种音频帧的对应关系,直到PTS值正确的插入PES帧的帧头,所以具有极好的音视频同步指标,音频编码的实时性较强。针对音频帧长度较长,音频数据速率较小的特点。编码器外部DDR存储完整的音频帧,编码器片内的输入缓冲器只缓存一个极小的DDR读写brust长度的数本文档来自技高网
...
一种多通道数字音频编码音视频同步的方法

【技术保护点】
一种多通道音频编码音视频同步的方法,其特征在于,包括以下步骤:并行的接收各通道音频PCM数据,将各通道音频PCM数据实时写入DDR;产生与PCM帧对应的PTS值,令PTS值分别与PCM帧,ES帧,PES帧确定对应关系;将PTS值插入PES帧的帧头。

【技术特征摘要】
1.一种多通道音频编码音视频同步的方法,其特征在于,包括以下步骤:并行的接收各通道音频PCM数据,将各通道音频PCM数据实时写入DDR;产生与PCM帧对应的PTS值,令PTS值分别与PCM帧,ES帧,PES帧确定对应关系;将PTS值插入PES帧的帧头。2.根据权利要求1所述的一种多通道音频编码音视频同步的方法,特征在于:并行的接收各通道音频PCM数据,将各通道音频PCM数据实时写入DDR,具体为:在各通道的输入端乒乓缓存短长度的音频PCM数据,将短长度的音频PCM数据以burst方式写入DDR。3.根据权利要求1所述的一种多通道音频编码音视频同步的方法,特征在于:产生与PCM帧对应的PTS值,令PTS值分别与PCM帧,ES帧,PES帧确定对应关系,具体为:当第i(1~n)通道的PCM帧的第一个数据从输入端输入时,将实时产生的PTS值写入第i(1~n)通道对应的PTS寄存器;写入第i(1~n)通道对应的PTS寄存器的PTS值与第i(1~n)通道的PCM帧具有对应关系;PTS值表示该PCM帧第一个数据的显示时间戳。4.根据权利要求3所述的一种多通道音频编码音视频同步的方法,其特征为:接收视频编码器中的PCR包,提取出PCR值,PCR值包含PCR_base值与PCR_ext值;本地PTS计数器对27Mhz时钟进行计数,本地PTS计数器分为PTS_base计数器与PTS_ext计数器;PTS_ext计数器计数范围为0到299,当PTS_ext计数300个27Mhz时钟周期后,将PTS_ext计数器归零,并且将PTS_base计数器的数值加1;PTS_base计数器与PTS_ext计数器的初始值为第一次提取的PCR_base值与PCR_ext值;当获取到PCR_base值,计算PCR_base值与本地PTS_base计数器数值的差值DIF_PTS;若DIF_PTS小于预设阈值,则本地PTS_base计数器和PTS_ext计数器的数值不进行校正,并将PTS_base值作为实时的与视频同步的PTS值;若DIF_PTS大于预设阈值,校正本地PTS_base计数器和PTS_ext计数器的数值。5.根据权利要求4所述的一种多通道音频编码音视频同步的方法,其特征为:其中若DIF_PTS大于预设阈值,校正本地PTS_base计数器和PTS_ext计数器的数值;具体为:若DIF_PTS大于预设阈值,将PTS_base计数器数值重置为DIF_PTS的二分之一与PTS_bas...

【专利技术属性】
技术研发人员:李科
申请(专利权)人:惠州市伟乐科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1