用于立体视频编解码的方法、装置及系统制造方法及图纸

技术编号：18119667 阅读：106 留言：0更新日期：2018-06-03 11:30

本申请公开了一种方法，包括：获取承载立体视频的N个视频图像序列，N为大于等于2的整数；基于所述N个视频图像序列，确定第一图像序列和N‑1个第二图像序列；将所述第一图像序列和N‑1个第二图像序列编码生成立体视频位流；其中，针对第二图像序列进行编码所采用的编码模式包括：序列间预测编码模式；所述序列间预测编码模式是指，以所述第一图像序列中的图像为参考帧、对所述第二图像序列中的像素块进行预测编码。

Method, device and system for stereo video codec

The present application discloses a method for obtaining a sequence of N video images carrying a stereo video, N as an integer greater than or equal to 2; based on the sequence of N video images, the first image sequence and the 1 second image sequences are determined, and the first image sequence and the 1 second image sequences of the N are generated to generate a stereoscopic video bit. Stream; in which the encoding mode used for encoding second image sequences includes: inter sequence predictive coding mode, the inter sequence prediction encoding mode is that the image in the first image sequence is a reference frame and the pixel block in the second image sequence is predicted.

全部详细技术资料下载

【技术实现步骤摘要】
用于立体视频编解码的方法、装置及系统
本申请涉及立体视频
，具体涉及用于立体视频编解码的方法、装置、系统及机器可读介质。
技术介绍
随着工业技术不断进步，3D电视和立体电影(3D电影)日渐普及，一些消费者已不再满足对于传统的二维(2D)视频内容信息的感官获取和娱乐诉求，而倾向于立体视频更逼真的效果体验。立体视频相比传统的二维视频，更能表现出场景画面的深度感和层次感，因此，使用立体视频技术来还原现实更具有临场感和真实性，其代表了虚拟化现实技术的重要方向。立体视频技术利用人的双目视差原理，利用摄像机在同一场景条件下同步摄录至少两个视频图像序列，然后通过编码处理生成立体视频位流，并存储在存储介质上或者通过网络发送给接收方。需要播放立体视频时，对从存储介质读取的、或者从网络接收到的立体视频位流经解码处理后还原生成立体视频信号，送达立体视频显示器展现，通过双目感官上的视差，从而使观看者获取到场景的纵向深度信息和体验到立体感。现有技术在将至少两个视频图像序列进行编码处理时，通常采用ITUH.264/AVC或者ISOMPEG-HHEVC等编码标准分别对每个视频图像序列进行独立编码，导致编码后生成的立体视频位流通常数据量较大，从而对存储空间或者网络带宽提出较大的挑战。以通过网络传输立体视频位流为例，由于需要占用较多的网络带宽，在网络带宽无法满足要求的情况下会因为网络拥塞丢包引起立体视频播放过程出现卡顿或者较高延迟，影响用户的观看体验。
技术实现思路
本申请提供一种方法，包括：获取承载立体视频的N个视频图像序列，N为大于等于2的整数；基于所述N个视频图像序列，确定第一图像...
用于立体视频编解码的方法、装置及系统

【技术保护点】
一种方法，其特征在于，包括：获取承载立体视频的N个视频图像序列，N为大于等于2的整数；基于所述N个视频图像序列，确定第一图像序列和N‑1个第二图像序列；将所述第一图像序列和N‑1个第二图像序列编码生成立体视频位流；其中，针对第二图像序列进行编码所采用的编码模式包括：序列间预测编码模式；所述序列间预测编码模式是指，以所述第一图像序列中的图像为参考帧、对所述第二图像序列中的像素块进行预测编码。

【技术特征摘要】
1.一种方法，其特征在于，包括：获取承载立体视频的N个视频图像序列，N为大于等于2的整数；基于所述N个视频图像序列，确定第一图像序列和N-1个第二图像序列；将所述第一图像序列和N-1个第二图像序列编码生成立体视频位流；其中，针对第二图像序列进行编码所采用的编码模式包括：序列间预测编码模式；所述序列间预测编码模式是指，以所述第一图像序列中的图像为参考帧、对所述第二图像序列中的像素块进行预测编码。2.根据权利要求1所述的方法，其特征在于，所述N为2；所述N个视频图像序列分别为对应于左眼和右眼的视频图像序列。3.根据权利要求1所述的方法，其特征在于，所述基于所述N个视频图像序列确定第一图像序列和N-1个第二图像序列，包括：从所述N个视频图像序列中选择一个视频图像序列作为所述第一图像序列，将其他各视频图像序列分别作为所述N-1个第二图像序列中的各序列。4.根据权利要求3所述的方法，其特征在于，所述基于所述N个视频图像序列确定第一图像序列和N-1个第二图像序列，还包括：按照预设的降采样方式，对每个视频图像序列中的每帧图像分别进行降采样；所述从所述N个视频图像序列中选择一个视频图像序列作为所述第一图像序列，将其他各视频图像序列分别作为所述N-1个第二图像序列中的各序列，包括：从降采样后的N个视频图像序列中选择一个视频图像序列作为所述第一图像序列，将其他降采样后的各视频图像序列分别作为所述N-1个第二图像序列中的各序列。5.根据权利要求1所述的方法，其特征在于，所述基于所述N个视频图像序列，确定第一图像序列和N-1个第二图像序列，包括：按照预设的预处理编码模式，根据所述N个视频图像序列生成子采样图像序列；按照所述预处理编码模式对应的拆分方式，将所述子采样图像序列中的每帧图像拆分成具有相同时间信息的N个图像，从而得到N个图像序列；从所述N个图像序列中，选择第一图像序列，并将其他图像序列作为所述N-1个第二图像序列。6.根据权利要求1所述的方法，其特征在于，采用以下步骤对第二图像序列中的待编码图像进行编码：根据按照预设方式设置的像素块尺寸，将待编码图像划分为多个待编码的像素块；依次对每个待编码的像素块，执行以下编码操作：根据所述待编码图像的编码类型，从包括序列间预测编码模式的相应编码模式集合中为待编码像素块选择满足预设条件的编码模式；采用所选编码模式对所述待编码像素块进行编码。7.根据权利要求6所述的方法，其特征在于，所述满足预设条件的编码模式包括：满足基于代价最小化的率失真优化模型的编码模式。8.根据权利要求7所述的方法，其特征在于，针对帧内编码类型，所述相应编码模式集合中包括：帧内预测编码模式、序列间预测编码模式；所述根据待编码图像的编码类型，从包括序列间预测编码模式的相应编码模式集合中为待编码像素块选择满足预设条件的编码模式，包括：计算采用帧内预测编码模式对所述待编码像素块进行编码的第一代价；计算以第一图像序列中的第一关联图像为参考帧，采用序列间预测编码模式对所述待编码像素块进行编码的第二代价；将所述第一代价和第二代价中最小值对应的编码模式，作为为所述待编码像素块选择的编码模式。9.根据权利要求8所述的方法，其特征在于，所述第一关联图像，包括：与所述待编码图像具有相同时间信息的图像。10.根据权利要求7所述的方法，其特征在于，针对帧间编码类型，所述相应预设编码模式集合中包括：帧内预测编码模式、帧间预测编码模式、以及序列间预测编码模式；所述根据待编码图像的编码类型，从包括序列间预测编码模式的相应编码模式集合中为待编码像素块选择满足预设条件的编码模式，包括：计算采用帧内预测编码模式对所述待编码像素块进行编码的第三代价；计算采用帧间预测编码模式对所述待编码像素块进行编码的第四代价；计算以第一图像序列中的第二关联图像为参考帧，采用序列间预测编码模式对所述待编码像素块进行编码的第五代价；将所述第三、第四、第五代价中最小值对应的编码模式，作为为所述待编码像素块选择的编码模式。11.根据权利要求10所述的方法，其特征在于，所述第二关联图像包括：与所述待编码图像具有相同时间信息的图像；或者，时间信息不晚于所述待编码图像的图像；或者，时间信息早于所述待编码图像的图像以及时间信息晚于所述待编码图像的图像。12.根据权利要求6所述的方法，其特征在于，按照预设方式设置像素块尺寸，包括：根据所述视频图像序列对应的图像解析度参数，设置所述像素块尺寸。13.根据权利要求8或10所述的方法，其特征在于，在计算第二代价或者第五代价的过程中，在第一关联图像或第二关联图像的重构图像中搜索所述待编码像素块的匹配像素块时，根据在针对所述待编码图像编码过程中、在所述重构图像中搜索匹配像素块得到的首个运动矢量，以及所述待编码像素块的坐标，确定在所述重构图像中的搜索起始坐标，并从所述搜索起始坐标开始搜索所述匹配像素块。14.根据权利要求6所述的方法，其特征在于，在对第二图像序列中的待编码图像进行编码的过程中，若存在两个或者两个以上连续像素块的参考帧相同且运动矢量相同，则将所述连续像素块的编码描述信息合并成一组写入所述立体视频位流中。15.根据权利要求1所述的方法，其特征在于，在将所述第一图像序列和N-1个第二图像序列编码生成立体视频位流之后，包括：将所述立体视频位流写入存储介质中；或者，向接收方发送所述立体视频位流。16.一种装置，其特征在于，包括：视频图像序列获取单元，用于获取承载立体视频的N个视频图像序列，N为大于等于2的整数；图像序列确定单元，用于基于所述N个视频图像序列，确定第一图像序列和N-1个第二图像序列；图像序列编码单元，用于将所述第一图像序列和N-1个第二图像序列编码生成立体视频位流；其中，针对第二图像序列进行编码所采用的编码模式包括：序列间预测编码模式；所述序列间预测编码模式是指，以所述第一图像序列中的图像为参考帧、对所述第二图像序列中的像素块进行预测编码。17.根据权利要求16所述的装置，其特征在于，所述N为2，所述视频图像序列获取单元，具体用于获取分别对应于左眼和右眼的两个视频图像序列。18.根据权利要求16所述的装置，其特征在于，所述图像序列确定单元，具体用于从所述N个视频图像序列中选择一个视频图像序列作为所述第一图像序列，将其他各视频图像序列分别作为所述N-1个第二图像序列中的各序列。19.根据权利要求18所述的装置，其特征在于，所述图像序列确定单元包括：降采样子单元，用于按照预设的降采样方式，对每个视频图像序列中的每帧图像分别进行降采样；序列选择子单元，用于从降采样后的N个视频图像序列中选择一个视频图像序列作为所述第一图像序列，将其他降采样后的各视频图像序列分别作为所述N-1个第二图像序列中的各序列。20.根据权利要求16所述的装置，其特征在于，所述图像序列确定单元包括：子采样序列生成子单元，用于按照预设的预处理编码模式，根据所述N个视频图像序列生成子采样图像序列；子采样序列拆分子单元，用于按照所述预处理编码模式对应的拆分方式，将所述子采样图像序列中的每帧图像拆分成具有相同时间信息的N个图像，从而得到N个图像序列；图像序列选择子单元，用于从所述N个图像序列中，选择第一图像序列，并将其他图像序列作为所述N-1个第二图像序列。21.根据权利要求16所述的装置，其特征在于，所述图像序列编码单元包括：第一图像序列编码子单元，用于对第一图像序列进行编码；第二图像序列编码子单元，用于对N-1个第二图像序列进行编码；所述第二图像序列编码子单元，包括：像素块划分子单元，用于根据按照预设方式设置的像素块尺寸，将待编码图像划分为多个待编码的像素块；循环控制子单元，用于针对每个待编码的像素块，依次调用以下模式选择子单元和像素块编码子单元进行编码处理；模式选择子单元，用于根据所述待编码图像的编码类型，从包括序列间预测编码模式的相应编码模式集合中为待编码像素块选择满足预设条件的编码模式；像素块编码子单元，用于采用所选编码模式对所述待编码像素块进行编码。22.根据权利要求21所述的装置，其特征在于，所述模式选择子单元，具体用于根据所述待编码图像的编码类型，从包括序列间预测编码模式的相应编码模式集合中为待编码像素块选择满足基于代价最小化的率失真优化模型的编码模式。23.根据权利要求22所述的装置，其特征在于，所述模式选择子单元包括针对帧内编码类型的以下子单元：第一代价计算子单元，用于计算采用帧内预测编码模式...

【专利技术属性】
技术研发人员：黄敦笔，张磊，杜武平，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛,KY

全部详细技术资料下载我是这个专利的主人