The invention provides a synchronous decoding method of multi-channel audio and video stream based on time stamp, which comprises the following steps: (a) through the panoramic camera to acquire the video at the same time, through the audio acquire single channel audio stream; (b) for each video stream and audio stream pretreatment; (c) synchronization of multi-channel video stream decoding by sequencing after pretreatment and single channel audio stream synchronization decoding algorithm based on time stamp.
【技术实现步骤摘要】
一种基于时间戳的多路音视频流同步解码方法
本专利技术涉及计算机编解码技术和计算机图形学技术,特别涉及一种基于时间戳的多路音视频流同步解码方法。
技术介绍
拼接式全景摄像机的成像过程是指将多个摄像头按照空间位置关系,固定安装在支架上,每个摄像头可以独立、高清地捕捉固定角度的图像。全景图像拼接技术是将不同相机在不同的时间、不同方向拍摄的图像,拼接到同一坐标系下进行全景展示。基于多摄像头的360度全景视频拼接,必须考虑到摄像头的个数,摄像头的个数越多,视频同步采集以及视频编解码的负荷量越大,同时增加了全景拼接融合的次数。由于多路拼接式全景摄像机的硬件设备无法做到精确的视频同步采集,若直接对采集后的多路H.264视频流和PCM音频流进行同时解码,无法保证音视频之间的同步以及视频间图像显示的时间同步性,拼接后的全景图像容易出现影像重叠现象。
技术实现思路
针对上述难题,本专利技术提供一种基于时间戳的多路音视频流同步解码方法。本专利技术提供一种基于时间戳的多路音视频流同步解码方法,其包括如下步骤:(a)通过全景摄像机获取多路视频流,同时通过音频采集器获取单路音频流;(b)对每一路视频流和单路音频流进行预处理;(c)通过基于时间戳的同步解码算法对预处理后的多路视频流和单路音频流进行同步排序解码。步骤(a)具体为通过拼接式全景摄像机采集同一时间、不同方向的多路视频流,其中视频流的格式为H.264;同时通过音频采集器获取对应的拍摄场景的PCM音频流。步骤(b)具体包括以下步骤:(b1)划分对每一路视频流的每一帧图像进行划分,得到多个h264图像包,并获取每一h264图像包的包长 ...
【技术保护点】
一种基于时间戳的多路音视频流同步解码方法,其包括如下步骤:(a)通过全景摄像机获取多路视频流,同时通过音频采集器获取单路音频流;(b)对每一路视频流和单路音频流进行预处理;(c)通过基于时间戳的同步解码算法对预处理后的多路视频流和单路音频流进行同步排序解码。
【技术特征摘要】
1.一种基于时间戳的多路音视频流同步解码方法,其包括如下步骤:(a)通过全景摄像机获取多路视频流,同时通过音频采集器获取单路音频流;(b)对每一路视频流和单路音频流进行预处理;(c)通过基于时间戳的同步解码算法对预处理后的多路视频流和单路音频流进行同步排序解码。2.一种如权利要求1所述的基于时间戳的多路音视频流同步解码方法,其特征在于,步骤(a)具体为通过拼接式全景摄像机采集同一时间、不同方向的多路视频流,其中视频流的格式为H.264;同时通过音频采集器获取对应的拍摄场景的PCM音频流。3.一种如权利要求2所述的所述的基于时间戳的多路音视频流同步解码方法,其特征在于,步骤(b)具体包括以下步骤:(b1)划分对每一路视频流的每一帧图像进行划分,得到多个h264图像包,并获取每一h264图像包的包长;(b2)对所述单路PCM音频流进行划分得到PCM音频包,并获取PCM音频包的包长;(b3)在每一个h264图像包和PCM音频包添加附加信息,用于解码识别。4.一种如权利要求3所述的基于时间戳的多路音视频流同步解码方法,其特征在于,所述步骤(b3)具体为:首先,在每一个h264图像包以及PCM音频包前均添加包头信息、时间戳信息以及包长信息,其中,所述包头信息用于每一路视频流中不同h264图像包/PCM音频包之间的划分和辨别,所述时间戳信息代表该帧图像拍摄时的时间点/每个PCM音频包的录制时间,所述包长信息用于记录该h264图像包/PCM音频包的存储长度;其次,以多路H.264格式的视频流和单路PCM音频流为基础建立多路PES视频流和单路PEA音频流,PES视频流和PEA音频流的文件内容排序为:包头信息、时间戳信息、包长信息、h264图像包/PCM音频包,其中,h264图像包来源于H.264格式的视频流的内容,h264图像包为每一帧图像经过H.264编码后得到,PCM音频包来源于PCM音频流的内容。5.一种如权利要求4所述的基于时间戳的多路音视频流同步解码方法,其特征在于,步骤(c)具体包括以下步骤:(c1...
【专利技术属性】
技术研发人员:陈春豪,肖江剑,宋康康,姜麟建,
申请(专利权)人:中国科学院宁波材料技术与工程研究所,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。