视频编解码方法及相关设备技术

技术编号:33337486 阅读:11 留言:0更新日期:2022-05-08 09:20
本申请涉及视频编解码领域,具体公开了一种视频编解码方法及相关设备。该视频编码方法包括:获取待编码图像的第一栅格图像,第一栅格图像是根据待编码图像的α图像得到的,待编码图像为待传输视频中的任一帧;对第一栅格图像进行四叉树栅格编码操作,以得到第一码流;对第二栅格图像进行类链式编码操作,以得到第二码流,第二栅格图像为第一栅格图像的掩膜图像;将第一码流和第二码流编入第三码流,第三码流是根据待编码图像的YUV图像进行熵编码得到的。通过对待编码图像的α图像的mask图像进行类链式编码,可有效防止mask图像的量化失真,从而达到抑制毛刺的作用。从而达到抑制毛刺的作用。从而达到抑制毛刺的作用。

【技术实现步骤摘要】
视频编解码方法及相关设备


[0001]本申请涉及视频编解码领域,尤其涉及一种视频编解码方法及相关设备。

技术介绍

[0002]目前,YUV视频编解码技术是一种发展比较成熟的技术,该技术被广泛用于视频通话,视频传输,视频录播与直播等领域。比较主流的视频编码技术包括AVC、HEVC、VP8与VP9等。YUVA视频联合编码技术是指在原本的视频编解码基础上,增加透明通道(A通道)的联合编码技术,通过增加A通道的视频编解码,可以有效对视频帧进行前后背景图像分离,因此,该方法未来将会广泛用于增强现实(augmented reality,AR)技术。由于目前主流的视频编码技术存在A通道的冗余明显,Mask边缘存在严重的毛刺。

技术实现思路

[0003]本申请实施例提供一种视频编解码方法及相关设备,通过对视频帧的α图像的mask图像进行类链式编码,可有效防止mask图像的量化失真,从而达到抑制毛刺的作用。
[0004]第一方面,本申请提供一种视频编码方法,包括:
[0005]获取待编码图像的第一栅格图像,第一栅格图像是根据待编码图像的α图像得到的,待编码图像为待传输视频中的任一帧;对第一栅格图像进行四叉树栅格编码操作,以得到第一码流;对第二栅格图像进行类链式编码操作,以得到第二码流,第二栅格图像为第一栅格图像的掩膜图像;根据待编码图像的YUV图像得到第三码流,将第一码流、第二码流和第三码流合并输出。
[0006]其中,将第一码流、第二码流和第三码流合并输出,具体包括:按照串行方式依次输出第一码流、第二码流和第三码。
[0007]通过对待编码图像的α图像的mask图像进行类链式编码,可有效防止mask图像的量化失真,从而达到抑制毛刺的作用;通过对待编码图像的α图像进行四叉树栅格化编码,使得后续熵编码时只需对待编码图像的α图像中的部分栅格进行编码,从而提高了编码效率。
[0008]在一个可行的实施例中,对第一栅格图像进行四叉树栅格编码操作,以得到第一码流,包括:
[0009]对第一栅格图像进行精细边缘AR编码,得到多个子区域中每个子区域的尺寸及该子区域的第一像素值,多个子区域是根据第一栅格图像得到的;对每个子区域的共性像素值的量化结果和该子区域的尺寸进行熵编码,以得到第一码流。
[0010]在一个可行的实施例中,对第一栅格图像进行精细边缘AR编码,得到多个子区域中每个子区域的尺寸及该子区域的第一像素值,包括:
[0011]对第一栅格图像进行四叉树栅格编码,得到多个子区域,多个子区域中的每个子区域内每个网格单元的像素值均相同;对多个子区域中的每个子区域进行离散余弦变换DCT,以得到每个子区域的共性像素值及该子区域的尺寸,每个子区域的共性像素值为该子
区域内任一网格单元的像素值;对多个子区域的共性像素值进行矢量量化,得到每个子区域的共性像素值的量化结果,每个子区域的共性像素值的量化结果为每个子区域的第一像素值。
[0012]由于上述子区域内栅格的像素值均相同,因此为了提高编码效率,对子区域进行DCT,得到该子区域的共性像素值及尺寸,再对共性像素值进行矢量量化,得到共性像素值的量化结果,后续编码时只需对子区域的尺寸及性像素值的量化结果进行编码,不需要对整个第一栅格图像的像素值进行编码,从而提高了编码效率。
[0013]在一个可行的实施例中,对第二栅格图像进行类链式编码操作,以得到第二码流,包括:
[0014]对第二栅格图像进行列值化处理,以得到第二栅格图像的第一向量;第二栅格图像的第一向量中的元素包括第二栅格图像中网格单元的像素值;根据第一向量中每个第一网格单元在第二栅格图像中与其相邻的第一网格单元的位置关系,对第二向量中的每个第一网格单元进行类链式编码,得到第二栅格图像的第二向量,第二向量中的每个元素用于指示在第二栅格图像中该元素对应的第一网格单元与前一个元素对应的第一网格单元的位置关系;第一向量中的第一网格单元为像素值为预设值的网格单元;对第二栅格图像的第二向量和第二栅格图像的尺寸进行熵编码,以得到第二码流。
[0015]第二栅格图像可以看成待编码图像的α图像的mask图像,通过对待编码图像的α图像的mask图像进行类链式编码,可有效防止mask图像的量化失真,从而达到抑制毛刺的作用。
[0016]在一个可行的实施例中,当待编码图像为I帧时,第一栅格图像为待编码图像的α图像,第二栅格图像为待编码图像的α图像的掩膜图像;
[0017]根据待编码图像的YUV图像得到第三码流,包括:对待编码图像的YUV图像进行熵编码得到第三码流;
[0018]当待编码图像为P帧时,第一栅格图像为待编码图像的α图像相对于待编码图像的参考帧的α图像的残差图像;
[0019]根据待编码图像的YUV图像得到第三码流,包括:根据根据待编码图像的参考帧的YUV图像和待编码图像的YUV图像得到待编码图像的YUV图像的残差图像;对待编码图像的YUV图像的残差图像进行熵编码,以得到第三码流。
[0020]在一个可行的实施例中,对待编码图像对应的音频信号进行编码,得到音频码流,并将该音频码流与第一码流、第二码流和第三码流合并输出;具体地,按照串行方式依次输出第一码流、第二码流、第三码流和音频码流。
[0021]在一个可行的实施例中,在对第一栅格图像、待编码图像的YUV图像和待编码图像对应的音频信号进行编码时,对第一栅格图像、待编码图像的YUV图像和待编码图像对应的音频信号打上相同的时间戳,然后将第一栅格图像的时间戳编入第一码流,将待编码图像的YUV图像的时间戳编入第三码流,并将待解码图像对应的音频信号的时间戳编入音频码流,从而使得解码端能从码流中解码出时间同步的待编码图像的重建帧和音频信号。
[0022]第二方面,本申请实施例还提供一种视频解码方法,包括:
[0023]获取视频的码流,视频的码流包括第一码流、第二码流和第三码流;对第一码流进行解码操作,以得到第一重建帧,第一重建帧与待解码图像的α图像的重建帧相关;待解码
图像为视频中的任一帧;对第二码流进行解码操作,以得到第二重建帧;第二重建帧与待解码图像的α图像的掩膜图像的重建帧相关;根据第三码流得到第三重建帧,该第三重建帧为待解码图像的YUV图像的重建帧;根据第一重建帧和第二重建帧得到目标α图像的重建帧,根据目标α图像的重建帧对第三重建帧进行图像分割和叠加,以得到待解码图像的重建帧,待解码图像的重建帧为背景透明的第三重建帧。
[0024]其中,当待解码图像为I帧时,第一重建帧为待解码图像的α图像的重建帧,第二重建帧为待解码图像的α图像的掩膜图像的重建帧;根据第三码流得到第三重建帧,包括:对第三码流进行解码,得到第三重建帧;当待解码图像为P帧时,第一重建帧为待解码图像的α图像的残差图像的重建帧,第二重建帧为待解码图像的α图像的残差图像的掩膜图像的重建帧;根据第三码流得到第三重建帧,包括:对第三码流进行解码,以得到待解码图像的YUV图像的残差图像的重建帧;根据待解码本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频编码方法,其特征在于,包括:获取待编码图像的第一栅格图像,所述第一栅格图像是根据所述待编码图像的α图像得到的,所述待编码图像为待传输视频中的任一帧;对第一栅格图像进行四叉树栅格编码操作,以得到第一码流;对所述第二栅格图像进行类链式编码操作,以得到第二码流,第二栅格图像为所述第一栅格图像的掩膜图像;根据所述待编码图像的YUV图像得到第三码流;将所述第一码流、所述第二码流和第三码流合并输出。2.根据权利要求1所述的方法,其特征在于,所述对所述第一栅格图像进行四叉树栅格编码操作,以得到第一码流,包括:对所述第一栅格地图进行精细边缘增强现实AR编码,得到多个子区域中每个子区域的尺寸和该子区域的第一像素值,所述多个子区域是根据所述第一栅格图像得到的;对所述多个子区域中每个子区域的尺寸和该子区域的第一像素值进行熵编码,以得到所述第一码流。3.根据权利要求2所述的方法,其特征在于,所述对所述第一栅格地图进行精细边缘增强现实AR编码,得到多个子区域中每个子区域的尺寸和该子区域的第一像素值,包括:对所述第一栅格图像进行四叉树栅格编码,得到所述多个子区域,所述多个子区域中的每个子区域内每个网格单元的像素值均相同;对所述多个子区域中的每个子区域进行离散余弦变换DCT,以得到所述每个子区域的共性像素值及该子区域的尺寸,所述每个子区域的共性像素值为该子区域内任一网格单元的像素值;对所述多个子区域的共性像素值进行矢量量化,得到每个子区域的共性像素值的量化结果,所述每个子区域的共性像素值的量化结果为所述每个子区域的第一像素值。4.根据权利要求1

3任一项所述的方法,其特征在于,所述对所述第二栅格图像进行类链式编码操作,以得到第二码流,包括:对所述第二栅格图像进行列值化处理,以得到所述第二栅格图像的第一向量;所述第二栅格图像的第一向量中的元素包括所述第二栅格图像中网格单元的像素值;根据所述第一向量中每个第一网格单元在所述第二栅格图像中与其相邻的第一网格单元的位置关系,对所述第二向量中的每个第一网格单元进行类链式编码,得到所述第二栅格图像的第二向量,所述第二向量中的每个元素用于指示在所述第二栅格图像中该元素对应的第一网格单元与前一个元素对应的第一网格单元的位置关系;所述第一向量中的第一网格单元为像素值为预设值的网格单元;对所述第二栅格图像的第二向量和所述第二栅格图像的尺寸进行熵编码,以得到所述第二码流。5.根据权利要求1

4任一项所述的方法,其特征在于,当所述待编码图像为I帧时,所述第一栅格图像为所述待编码图像的α图像。6.根据权利要求1

4任一项所述的方法,其特征在于,当所述待编码图像为I帧时,所述根据所述待编码图像的YUV图像得到第三码流,包括:对所述待编码图像的YUV图像进行熵编码,以得到所述第三码流。7.根据权利要求1

4任一项所述的方法,其特征在于,当所述待编码图像为P帧时,所述
第一栅格图像是根据所述待编码图像的α图像得到的,包括:所述第一栅格图像为所述待编码图像的α图像相对于所述待编码图像的参考帧的α图像的残差图像;所述根据待编码图像的YUV图像得到第三码流,包括:根据所述待编码图像的参考帧的YUV图像和所述待编码图像的YUV图像得到所述待编码图像的YUV图像的残差图像;对所述待编码图像的YUV图像的残差图像进行熵编码,以得到所述第三码流。8.根据权利要求1

7任一项所述的方法,其特征在于,所述将所述第一码流、所述第二码流和第三码流合并输出,包括:按照串联方式依次输出所述第一码流、所述第二码流和所述第三码流。9.根据权利要求1

8任一项所述的方法,其特征在于,所述方法还包括:对所述待编码图像对应的音频信号进行编码,以得到音频码流。10.一种视频解码方法,其特征在于,包括:获取所述视频的码流,所述视频的码流包括第一码流、第二码流和第三码流;对所述第一码流进行解码操作,以得到第一重建帧,所述第一重建帧与待解码图像的α图像的重建帧相关;所述待解码图像为所述视频中的任一帧;对所述第二码流进行解码操作,以得到第二重建帧;所述第二重建帧与所述待解码图像的α图像的掩膜图像的重建帧相关;根据所述第三码流得到第三重建帧,所述第三重建帧为所述待解码图像的YUV图像的重建帧;根据所述第一重建帧和所述第二重建帧得到目标α图像的重建帧,根据目标α图像的重建帧对第三重建帧进行图像分割和叠加,以得到待解码图像的重建帧,所述待解码图像的重建帧为背景透明的第三重建帧。11.根据权利要求10所述的方法,其特征在于,所述对所述第一码流进行解码操作,以得到第一重建帧,包括:对所述第一码流进行熵解码,得到所述第一重建帧的多个子区域的每个子区域的第一像素值及所述每个子区域的尺寸;对所述第一重建帧的多个子区域的每个子区域的第一像素值及所述每个子区域的尺寸进行精细边缘增强现实AR解码,得到所述第一重建帧。12.根据权利要求11所述的方法,其特征在于,所述对所述第一重建帧的多个子区域的每个子区域的第一像素值及所述每个子区域的尺寸进行精细边缘增强现实AR解码,得到所述第一重建帧,包括:对所述多个子区域的第一像素值进行逆矢量量化,以得到所述多个子区域中每个子区域的共性像素值;根据所述多个子区域中每个子区域的共性像素值及尺寸进行逆离散余弦变换DCT,以得到多个子区域,所述每个子区域内的每个像素值均为所述共性像素值;对所述多个...

【专利技术属性】
技术研发人员:高扬梁运恺
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1