一种用于可伸缩视频编码的分层式模式决策方法技术

技术编号:12140336 阅读:74 留言:0更新日期:2015-10-01 19:20
一种用于可伸缩视频编码的分层式模式决策方法,本发明专利技术涉及视频编码技术领域。本发明专利技术解决现有可伸缩视频编码的快速编码技术存在的缺少层间和空间编码模式的相关性模型、关键帧信息未得到合理利用等问题。本发明专利技术通过1定义基本层和增强层编码模式相关性;2计算基本层和增强层编码模式相关性数据;3定义当前宏块与其空间相邻宏块间编码模式相关性;4计算空间相邻宏块间编码模式相关性数据;5检查基本层相应宏块的编码模式;6检查空间相邻宏块的编码模式;7测量当前宏块的同质性;8测量当前宏块的运动剧烈程度;9确定运动向量搜索范围和候选模式,并根据各模式的率失真代价,选择最优编码模式;本发明专利技术应用于可伸缩视频编码的快速编码领域。

【技术实现步骤摘要】

本专利技术涉及视频编码的快速模式决策方法,特别涉及一种用于可伸缩视频编码的 分层式模式决策方法。
技术介绍
基于H. 264/AVC视频编码标准的可伸缩扩展(SVC)是由国际电联电信标准化部门 (ITU-T)视频编码专家组(VCEG)和国际标准化组织(ISO)动态图像专家组(MPEG)组成的 联合视频专家组(JVT)共同制定的国际可伸缩视频编码标准。为了实现对可伸缩性的支 持,SVC标准采用了多层编码框架,继承了H. 264/AVC标准中所有的先进编码技术并引入了 层间编码技术和工具。SVC标准优异的编码性能是以极高的运算复杂度为代价的。这些复 杂度极高的算法导致SVC视频编解码系统的运算效率大大降低,无法满足实时视频通信的 需求,严重阻碍了新一代视频编码标准的推广与应用。现有快速可伸缩视频编码技术存在 的主要问题有: 1、缺少编码层间相关性模型。SVC标准采用了基于层的编码框架和层间预测技术, 新的编码技术和工具带来了新的编码特性。现有的基于SVC标准的快速模式决策算法没有 分析和探讨基于层的编码框架和层间预测技术所引入的新的编码特性,没有建立基本层编 码模式和增强层编码模式之间的相关性模型。因此,现有的算法无法充分利用基本层编码 的先验知识以及层间的相关性降低增强层层间预测的复杂度。 2、缺少编码模式相关性模型。视频序列帧间具有很强的相关性,尤其在相对静止 的区域,相邻帧之间的图像差别很小。除了图像内容存在很强的相关性,帧间预测模式之间 也存在很强的相关性,可以通过帧间相邻单元的编码模式等信息预测待编码单元可能的编 码模式。尽管有人提出了利用帧间编码模式的相关性来进行模式预判的算法,但目前这类 算法中帧间编码模式间的相关性关系是利用经验建立的,缺乏理论支撑。 3、关键帧信息未得到合理利用。并非所有底层的上采样数据都适合层间预测,尤 其对于包含缓慢运动和丰富空间细节视频序列。因此需要有效地度量视频序列的运动剧烈 程度以及空间细节的多少。关键帧信息可以为此提供有价值的参考。但是,关键帧中提供 的上下文信息在现有的算法中并没有得到充分利用。 4、快速SVC编码系统的性能较差。现有的基于SVC标准的快速模式决策算法未充 分整合层间,空间,时间相关性信息。导致算法要么对编码效率的影响较大,要么对具有不 同特征的视频序列不具有普适性。
技术实现思路
本专利技术的目的是为了解决现有快速可伸缩视频编码技术存在的缺少编码层间相 关性模型、缺少编码模式相关性模型、关键帧信息未得到合理利用以及快速SVC编码系统 的性能较差的问题,而提出的。 上述的专利技术目的是通过以下技术方案实现的: 步骤一、定义基本层和增强层编码模式的相关性;即当基本层宏块的编码模式是 M0DE_SKIP时,增强层中,与基本层宏块对应位置处的宏块的编码模式也为M0DE_SKIP的概 率; 步骤二、对具有不同运动剧烈程度和图像细节的视频序列,利用JSVM9. 18参考软 件进行编码,并利用基本层和增强层编码模式的相关性,计算基本层和增强层的编码模式 相关性数据; 步骤三、定义当前宏块与当前宏块的空间相邻宏块间的编码模式相关性,即当增 强层中当前宏块的编码模式是M0DE_SKIP时,增强层中当前宏块的左边相邻宏块和上方相 邻宏块中的一个或两个宏块的编码模式也为M0DE_SKIP的概率; 步骤四、对具有不同运动剧烈程度和图像细节的视频序列,利用JSVM9. 18参考软 件进行编码,并根据当前宏块与当前宏块的空间相邻宏块间的编码模式相关性的定义,计 算当前宏块与当前宏块的空间相邻宏块间的编码模式相关性数据; 步骤五、检查增强层中当前宏块在基本层的相应宏块的编码模式是否为帧内编 码;若增强层当前宏块在基本层相应宏块的编码模式为帧内编码,则增强层当前宏块通常 包含复杂的运动或者细致的纹理信息,采用穷举式的模式选择算法,在增强层当前宏块中 所有候选模式中选择Lagrangian率失真代价最小的,作为增强层当前宏块的最优编码模 式;否则,进入步骤六进行处理; 步骤六、根据步骤二中得到的基本层和增强层的编码模式相关性数据和步骤四中 得到的当前宏块与当前宏块的相邻宏块间的编码模式相关性数据,检查增强层中当前宏块 在基本层相应宏块的编码模式以及当前宏块的空间相邻宏块的编码模式;如果增强层当前 宏块的空间相邻宏块或基本层中的相应位置宏块中至少有一个宏块的编码模式为M0DE_ SKIP,则比较M0DE_SKIP和M0DE_16X16 的Lagrangian率失真代价;如果M0DE_SKIP的率 失真代价比M0DE_16X16的Lagrangian率失真代价小,那么将M0DE_SKIP选作当前宏块的 最优编码模式;否则,进入步骤七进行处理;其中,当前宏块的相邻宏块包括增强层中的当 前宏块左边相邻宏块、当前宏块上方相邻宏块,以及当前宏块在基本层中的相应位置的宏 块; 步骤七、根据AC系数的能量测量当前宏块内容的同质性;如果AC系数的能量 小于等于阈值则宏块内容的同质性较高,则根据Lagrangian代价函数从宏块编码模式 M0DE_16X16、M0DE_16X8和M0DE_8X16中依据Lagrangian率失真代价选择最优编码模 式,如果AC系数的能量大于阈值则宏块内容的同质性较低,进入步骤八进行处理; 步骤八、如果当前宏块在基本层中的相应宏块的MVD值能量大于阈值,则当前宏 块内容运动剧烈,则进行步骤九;否则即MVD小于等于阈值则图像中运动剧烈程度小,进行 步骤十;其中,MVD值为每个图像组的关键帧之间的运动向量差即实际运动向量与运动向 量预测值间的差值MVD; 步骤九:保持当前宏块的默认搜索范围,从所有候选模式中,选择Lagrangian率 失真代价最小的,作为当前宏块的最优编码模式,结束当前宏块的模式决策过程;其中,候 选编码模式包括所有候选模式; 步骤十:将搜索范围减小为步骤九所述的搜索范围的一半,从候选编码模式 M0DE_8X8、M0DE_8X4、M0DE_4X8、M0DE_4X4 以及层间预测模式中选择Lagrangian率 失真代价最小的,作为当前宏块的最优编码模式,结束当前编码宏块的模式决策过程;其 中,层间预测模式包括层间纹理预测inter-layertextureprediction、层间运动预测 inter-layermotionprediction和层间歹曳差预测inter-layerresidualprediction;艮P 完成了。 专利技术效果 本专利技术创造所提出的正是针对 以上问题提出的:通过对不同编码层中的编码单元的划分方式和预测方向,空间相邻编码 块的编码方式进行相关性分析,利用离散余弦变换(DCT)系数与图像内容间的关系,以及 关键帧提供的上下文信息,构建了一套充分利用层间、空间、时间相关性以及图像自身特征 的快速SVC模式决策算法。该算法的提出可以有效解决SVC标准编码复杂度过高,远不能满 足实时应用需求的问题,促进可伸缩视频编码标准的完善,推动其编码性能的进一步提升, 尤其是可以突破其在实时性应用方面的障碍。因此,本专利技术对我国未来视频应用业务的发 展将提供重要的理论与技术支撑。 为了验证本专利技术的有效性,我们将所提出的算法整本文档来自技高网
...

【技术保护点】
一种用于可伸缩视频编码的分层式模式决策方法,其特征在于一种用于可伸缩视频编码的分层式模式决策方法具体是按照以下步骤进行的:步骤一、定义基本层和增强层编码模式的相关性;即当基本层宏块的编码模式是MODE_SKIP时,增强层中,与基本层宏块对应位置处的宏块的编码模式也为MODE_SKIP的概率;步骤二、对具有不同运动剧烈程度和图像细节的视频序列,利用JSVM9.18参考软件进行编码,并利用基本层和增强层编码模式的相关性,计算基本层和增强层的编码模式相关性数据;步骤三、定义当前宏块与当前宏块的空间相邻宏块间的编码模式相关性,即当增强层中当前宏块的编码模式是MODE_SKIP时,增强层中当前宏块的左边相邻宏块和上方相邻宏块中的一个或两个宏块的编码模式也为MODE_SKIP的概率;步骤四、对具有不同运动剧烈程度和图像细节的视频序列,利用JSVM9.18参考软件进行编码,并根据当前宏块与当前宏块的空间相邻宏块间的编码模式相关性的定义,计算当前宏块与当前宏块的空间相邻宏块间的编码模式相关性数据;步骤五、检查增强层中当前宏块在基本层的相应宏块的编码模式是否为帧内编码;若增强层当前宏块在基本层相应宏块的编码模式为帧内编码,则增强层当前宏块通常包含复杂的运动或者细致的纹理信息,采用穷举式的模式选择算法,在增强层当前宏块中所有候选模式中选择Lagrangian率失真代价最小的,作为增强层当前宏块的最优编码模式;否则,进入步骤六进行处理;步骤六、根据步骤二中得到的基本层和增强层的编码模式相关性数据和步骤四中得到的当前宏块与当前宏块的相邻宏块间的编码模式相关性数据,检查增强层中当前宏块在基本层相应宏块的编码模式以及当前宏块的空间相邻宏块的编码模式;如果增强层当前宏块的空间相邻宏块或基本层中的相应位置宏块中至少有一个宏块的编码模式为MODE_SKIP,则比较MODE_SKIP和MODE_16×16的Lagrangian率失真代价;如果MODE_SKIP的率失真代价比MODE_16×16的Lagrangian率失真代价小,那么将MODE_SKIP选作当前宏块的最优编码模式;否则,进入步骤七进行处理;其中,当前宏块的相邻宏块包括增强层中的当前宏块左边相邻宏块、当前宏块上方相邻宏块,以及当前宏块在基本层中的相应位置的宏块;步骤七、根据AC系数的能量测量当前宏块内容的同质性;如果AC系数的能量小于等于阈值则宏块内容的同质性较高,则根据Lagrangian代价函数从宏块编码模式MODE_16×16、MODE_16×8和MODE_8×16中依据Lagrangian率失真代价选择最优编码模式,如果AC系数的能量大于阈值则宏块内容的同质性较低,进入步骤八进行处理;步骤八、如果当前宏块在基本层中的相应宏块的MVD值能量大于阈值,则当前宏块内容运动剧烈,则进行步骤九;否则即MVD小于等于阈值则图像中运动剧烈程度小,进行步骤十;其中,MVD值为每个图像组的关键帧之间的运动向量差即实际运动向量与运动向量预测值间的差值MVD;步骤九:保持当前宏块的默认搜索范围,从所有候选模式中,选择Lagrangian率失真代价最小的,作为当前宏块的最优编码模式,结束当前宏块的模式决策过程;其中,候选编码模式包括所有候选模式;步骤十:将搜索范围减小为步骤九所述的搜索范围的一半,从候选编码模式MODE_8×8、MODE_8×4、MODE_4×8、MODE_4×4以及层间预测模式中选择Lagrangian率失真代价最小的,作为当前宏块的最优编码模式,结束当前编码宏块的模式决策过程;其中,层间预测模式包括层间纹理预测inter‑layer texture prediction、层间运动预测inter‑layer motion prediction和层间残差预测inter‑layer residual prediction;即完成了一种用于可伸缩视频编码的分层式模式决策方法。...

【技术特征摘要】

【专利技术属性】
技术研发人员:卢鑫胡悦金雪松肖楠郭俊汐
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:黑龙江;23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1