一种H.264到H.265的视频转码方法及转码器技术

技术编号:10408024 阅读:1050 留言:0更新日期:2014-09-10 17:29
本发明专利技术提出一种H.264到H.265的视频转码方法,包括H.264解码过程和H.265编码过程,所述H.264解码过程,是将符合H.264标准的码流完全解码到像素域,解码中提取出所有I帧中每个宏块的编码宏块类型、编码块模式、残差和所有P帧中每个宏块的编码宏块类型、运动矢量、参考帧及残差;所述H.265编码过程,是根据H.264解码结果进行H.265编码,得到H.265视频,包括根据CTU设置和帧类型进行相应处理,恰当地减少搜索分支,减少编码复杂度。因此,本发明专利技术能在保证视频质量下降较少、码率增加不多的情况下,有效减少视频转码时间,有助于H.265标准的推广及节省网络带宽。

【技术实现步骤摘要】
一种H.264到H.265的视频转码方法及转码器
本专利技术属于图像压缩技术和计算机技术两大领域,具体涉及一种H.264到H.265快速转码的技术方案。
技术介绍
当前我互联网事业进入飞速发展期,多媒体技术在人们工作、学习、娱乐中的地位显得越发重要。而作为多媒体技术中最重要,最具表现力的视频编码技术也随着时代迅猛发展。从1990年提出的H.261到上一代的视频编码标准H.264,几十年间视频编码技术在不断的更新与进步。如今ITU-TVCEG又发布了新一代视频编码标准H.265(也称为HEVC),较之前的编码标准,H.265采用了更先进的编码技术,提高了编码效率。目前,得到最广泛采用的视频压缩技术中的一种称为H.264的标准。H.264是一种基于块匹配的混合编码的压缩方案。编码器将帧分为多个正方形小块,称为宏块,每个宏块包含16×16大小的像素。为了图像数据进行压缩,编码器对每个宏块进行预测、变换、编码以减小数据量。其中预测包括帧内预测与帧间预测。帧内预测利用了图片在空间上的相关性,主要是利用了当前宏块左侧与上侧的宏块的像素值来对当前宏块进行预测。帧间预测则利用了图像在时间上的相关性,找出相邻几帧中与当前宏块相似的区域来对本帧进行预测。然后用原始图像减去预测图象形成残差,编码器只需对残差及预测信息(帧内预测的预测模式、帧间预测的运动矢量和参考帧等)进行变换、量化、编码即可完成压缩。近来,ISO/IEC运动图像专家组和ITU-T视频编码专家组(VCEG)联合推出了新一代视频编码标准H.265/HEVC。与早期视频编码标准类似,H.265/HEVC沿袭了传统的混合编码框架。编码思路基本不变,编码器主要由帧内预测(intraprediction)、帧间预测(interprediction)、转换(transform)、量化(quantization)、去区块滤波器(deblockingfilter)、熵编码(entropycoding)等组成。但H.265\HEVC采用了更灵活的编码树结构代替H.264中的宏块进行划分,其支持的大小也从16×16像素扩展到64×64像素。H.265\HEVC采用了先进的预测方法对图片进行预测,帧内预测方向从原有的8个方向增加到33个,帧间增加了Merge模式,提高了图像压缩率。据统计,H.265/HEVC在主观质量不变的基础上,码率降低一半以上,具有巨大的发展潜力。但H.265/HEVC的高压缩是以提高了编码复杂度为代价的,其编码复杂度为之前H.264的3到4倍,编码速度成为了当前亟待解决的关键问题。进过多年的推广,H.264已广泛用于数字视频分发、存储和播放的应用中,由于新的视频编码标准H.265的推出,为了节省网络带宽降低视频比特率,提高视频服务质量,因此提供用于对使用新标准的设备和使用现有标准的设备进行接口的相关措施是很有必要的,并且此类接口能将H.265视频标准逐步引入到现有的视频系统中。目前,视频转码按照结构主要分为两大类:像素域转码和变换域转码。像素域转码是指对输入视频完全解码得到像素域图像序列,在像素域进行再编码,像素域转码实现灵活,并且输出图像质量较高,但转码复杂度高。变换域转码则不需要完全解码出像素域图像,而是在变换域直接对压缩域系数进行变换,重新封装得到转码视频,减少了重新编码的计算量。但H.264编码标准和H.265编码标准中基本编码单元差别较大,变换尺寸也存在差异,因此在变换域直接把H.264编码的视频转换成H.265是比较困难的。由于H.264编码标准和H.265编码标准之间存在着较大的差异,因此目前将H.264视频信号转码成H.265格式的主要方法是,在H.264解码器中将H.264视频完全解码为YUV格式,随后再利用H.265编码器中对解码的YUV信号进行重新编码。不过,这种方法有一个非常重要的缺点,即它需要相当多的计算资源,且时间消耗过大,特别对于H.265这种高复杂度的编码而言,实时转码在普通计算机上尤为困难。通常,视频信号的独立解码和编码还可能会导致视频质量的下降,因为重新编码期间做出的决定并没有考虑原始编码的参数。因此,目前的H.264到H.265转码器转码效率不高,消耗资源大,且设备昂贵,往往不能满足于实际的工程需求。研究一种快速的转码方案可以说是非常有意义的。
技术实现思路
本专利技术的目的是针对现有技术缺陷,提出一种高效低耗的H.264到H.265转码方案。本专利技术提供一种H.264到H.265的视频转码方法,包括H.264解码过程和H.265编码过程,所述H.264解码过程,是将符合H.264标准的码流完全解码到像素域,解码中提取出所有I帧中每个宏块的编码宏块类型、编码块模式、残差和所有P帧中每个宏块的编码宏块类型、运动矢量、参考帧及残差;所述H.265编码过程,是根据H.264解码结果进行H.265编码,得到H.265视频,包括根据CTU设置和帧类型进行以下相应处理,处理A.当H.265中设置的CTU大小为16×16且帧类型为I帧时,进行帧内处理如下,若H.264中宏块为I16x16类型,则H.265中CTU不继续划分,且预测模式及预测方向与H.264中保持一致;若H.264中宏块为I8x8类型,则H.265中CTU划分一次,分为4个CU,CTU中4个CU的预测模式及预测方向分别与H.264中4个子宏块一致;若H.264中宏块为I4x4类型,则利用H.265标准的原有搜索过程进行处理;处理B.当H.265中设置的CTU大小为16×16且帧类型为P帧时,进行帧内处理如下,若H.264中宏块为P16x16类型,则H.265中CTU不划分,并搜索相应大小模式及Merge模式,并取率失真代价较小的作为最终模式,若H.264中宏块为P8x8类型、P16x8类型或P8x16类型,则H.265中CTU按同样方式划分,并对每个CU搜索相应大小模式及Merge模式,并取率失真代价较小的作为最终模式;若H.264宏块为Pskip模式,则H.265中CTU直接使用Merge模式;如果选择相应大小模式,运动矢量和参考帧与H.264中保持一致;否则,利用H.265标准中Merge模式相应原有算法算得运动信息;处理C.当H.265中设置的CTU大小为32×32且帧类型为I帧时,进行帧内处理如下,若残差值大于或等于相应预设阈值,则直接进行一次CTU划分,成为4个16×16大小的CU,并分别执行处理A;若残差值小于相应预设阈值,则搜索32×32及16×16模式,选取率失真代价较小的作为最终模式;处理D.当H.265中设置的CTU大小为32×32且帧类型为P帧时,进行帧内处理如下,若残差值小于相应预设阈值且CTU对应的H.264中4个宏块的运动矢量之间的距离小于相应预设阈值,则CTU搜索2N×2N模式与Merge模式,并取率失真代价较小的作为最终模式,其中2N×2N模式的运动矢量为4个宏块的运动矢量的平均值;若不满足上述条件,则CTU继续划分,得到4个16×16大小的CU,其后搜索方式与P帧CTU16×16情况相同,即分别执行处理B;其中,所述CTU为编码树单元,所述CU为编码单元。本专利技术能够实现在现有转码器的基础上降低的转码复杂度、成本以及改善的转码性能的目的本文档来自技高网
...
一种H.264到H.265的视频转码方法及转码器

【技术保护点】
一种H.264到H.265的视频转码方法,其特征在于:包括H.264解码过程和H.265编码过程,所述H.264解码过程,是将符合H.264标准的码流完全解码到像素域,解码中提取出所有I帧中每个宏块的编码宏块类型、编码块模式、残差和所有P帧中每个宏块的编码宏块类型、运动矢量、参考帧及残差;所述H.265编码过程,是根据H.264解码结果进行H.265编码,得到H.265视频,包括根据CTU设置和帧类型进行以下相应处理,处理A.当H.265中设置的CTU大小为16×16且帧类型为I帧时,进行帧内处理如下,若H.264中宏块为I16x16类型,则H.265中CTU不继续划分,且预测模式及预测方向与H.264中保持一致;若H.264中宏块为I8x8类型,则H.265中CTU划分一次,分为4个CU,CTU中4个CU的预测模式及预测方向分别与H.264中4个子宏块一致;若H.264中宏块为I4x4类型,则利用H.265标准的原有搜索过程进行处理;处理B.当H.265中设置的CTU大小为16×16且帧类型为P帧时,进行帧内处理如下,若H.264中宏块为P16x16类型,则H.265中CTU不划分,并搜索相应大小模式及Merge模式,并取率失真代价较小的作为最终模式,若H.264中宏块为P8x8类型、P16x8类型或P8x16类型,则H.265中CTU按同样方式划分,并对每个CU搜索相应大小模式及Merge模式,并取率失真代价较小的作为最终模式;若H.264宏块为Pskip模式,则H.265中CTU直接使用Merge模式;如果选择相应大小模式,运动矢量和参考帧与H.264中保持一致;否则,利用H.265标准中Merge模式相应原有算法算得运动信息;处理C.当H.265中设置的CTU大小为32×32且帧类型为I帧时,进行帧内处理如下,若残差值大于或等于相应预设阈值,则直接进行一次CTU划分,成为4个16×16大小的CU,并分别执行处理A;若残差值小于相应预设阈值,则搜索32×32及16×16模式,选取率失真代价较小的作为最终模式;处理D.当H.265中设置的CTU大小为32×32且帧类型为P帧时,进行帧内处理如下,若残差值小于相应预设阈值且CTU对应的H.264中4个宏块的运动矢量之间的距离小于相应预设阈值,则CTU搜索2N×2N模式与Merge模式,并取率失真代价较小的作为最终模式,其中2N×2N模式的运动矢量为4个宏块的运动矢量的平均值;若不满足上述条件,则CTU继续划分,得到4个16×16大小的CU,其后搜索方式与P帧CTU16×16情况相同,即分别执行处理B;其中,所述CTU为编码树单元,所述CU为编码单元。...

【技术特征摘要】
1.一种H.264到H.265的视频转码方法,其特征在于:包括H.264解码过程和H.265编码过程,所述H.264解码过程,是将符合H.264标准的码流完全解码到像素域,解码中提取出所有I帧中每个宏块的编码宏块类型、编码块模式、残差和所有P帧中每个宏块的编码宏块类型、运动矢量、参考帧及残差;所述H.265编码过程,是根据H.264解码结果进行H.265编码,得到H.265视频,包括根据CTU设置和帧类型进行以下相应处理,处理A.当H.265中设置的CTU大小为16×16且帧类型为I帧时,进行帧内处理如下,若H.264中宏块为I16x16类型,则H.265中CTU不继续划分,且预测模式及预测方向与H.264中保持一致;若H.264中宏块为I8x8类型,则H.265中CTU划分一次,分为4个CU,CTU中4个CU的预测模式及预测方向分别与H.264中4个子宏块一致;若H.264中宏块为I4x4类型,则利用H.265标准的原有搜索过程进行处理;处理B.当H.265中设置的CTU大小为16×16且帧类型为P帧时,进行帧间处理如下,若H.264中宏块为P16x16类型,则H.265中CTU不划分,并搜索相应大小模式及Merge模式,包括搜索2Nx2N及Merge模式,并取率失真代价较小的作为最终模式,若H.264中宏块为P8x8类型、P16x8类型或P8x16类型,则H.265中CTU按同样方式划分,并对每个CU搜索相应大小模式及Merge模式,并取率失真代价较小的作为最终模式...

【专利技术属性】
技术研发人员:张新晨羿舒文黎伟江昊华哲
申请(专利权)人:华中师范大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1