一种基于HEVC的整数DCT变换方法技术

技术编号:13013251 阅读:45 留言:0更新日期:2016-03-16 10:25
本发明专利技术公开了一种基于HEVC的整数DCT变换方法,包括:输入视频信号;提取视频信号中的数字图像;将提取的数字图像转化为8×8矩阵M8;将M8划分为四个4×4块;对四个4×4块分别进行整数DCT变换,得到经整数DCT变换的四个4×4块;将经整数DCT变换的四个4×4块合并得到经整数DCT变换的8×8矩阵C8,完成矩阵M8的整数DCT变换,完成对视频信号的时频转换。本发明专利技术以4×4块为最小变换单元逐步构建8×8,16×16,32×32的整数DCT变换单元,充分利用现有的计算单元,缩短计算时间,层次清晰的计算单元有利于流水线的构建,解决了现有整数DCT变换方案中多次重复取数和计算单元利用率低的问题。

【技术实现步骤摘要】

本专利技术设及视频图像编解码领域,尤其设及一种基于肥VC的整数DCT变换方法。
技术介绍
肥VC(Hi曲EfficiencyVideoCoding)是 2010 年 4 月VCEG和MPEG再次组建视 频编码联合组(JointColl油orativeTeamonVideoCoding,简称JCT-VC),联手制定的 新一代视频编码标准。 阳00引肥VC的核屯、变换沿用了AVC所采用的整数DCT技术,但其相比AVC整数变换有如 下特点: 1)肥VC采用4X4,8X8,16X16, 32X32四种尺寸的变换矩阵,并且允许根据视频 内容自适应的选择变换尺寸; 2)肥VC不同大小的变换矩阵形式较为统一,即不同大小的变换矩阵在整数化时放 大的倍数满足一定条件,使得放大后的各个矩阵元素值大小相同。 结合W上特点,目前肥VC整数变换的实现方法主要是通过开发具有统一形式的 整数DCT蝶形算法,如图1所示,通过依次循环复用计算单元来实现各个尺寸变换矩阵的自 适应过程,但该方法存在如下明显不足: 1)重复取数,计算时间过长。由于采用依次循环复用计算单元的实现,需要重复取 数四次,即依次对4X4,8X8, 16X16,32X32四种变换尺寸进行计算,而且每次只能完成 一种尺寸的变换输出,存在较大的取数延时和计算延时。 2)计算单元的利用率低。在具体的实现方案中,为了简化取数逻辑,提高数据计算 的吞吐率,通常在图1的基础上增加额外的并行单元来实现计算的并行,例如采用32点并 行计算,需要增加1组16X16, 2组8X8,4组4X4的计算单元,然而运样的实现方式在计 算过程中计算单元存在不同程度的闲置情况,例如在完成32X32变换过程中,额外增加的 1组16X16, 2组8X8,4组4X4全部闲置,同理,在完成8X8变化过程中,除4组4X4计 算单元闲置外,32X32,16X16计算单元中也有部分功能闲置。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于肥VC的整数DCT变换方法,能够有效 解决现有方案中多次重复取数和计算单元利用率低的问题,主要W4X4块为最小变换计 算单元,逐步构建8X8变换单元,并依此方法构建16X16, 32X32变换计算单元,使现有的 计算单元得到充分利用,缩短了计算时间,并且层次清晰的计算单元更有利于流水线的构 建。 为实现上述技术效果,本专利技术公开了一种基于肥VC的整数DCT变换方法,包括: 阳011] 输入视频信号; 提取所述视频信号中的数字图像; 将提取的所述数字图像转化为8X8矩阵M8 ; 将所述8X8矩阵M8划分为B8{1,リ、B8{1,リ、B8{2,リ和B8{2,リ四个4X4块; 阳0巧]利用4X4矩阵M4作为变换单元对B8{1,1}、B8{1,2}、B8{2a}和B8{2J}四个 4X4块分别进行整数DCT变换,得到经整数DCT变换的CS{I,U、CS{I,W、CS{2,U和CS{2, W四个4X4块拟及 将C8 {1,1}、C8 {1,2}、C8 {2,1}和C8 {2, 2}四个4X4块合并得到经整数DCT变换 的8X8矩阵C8,完成所述8X8矩阵M8的整数DCT变换,完成对所述视频信号的时频转换。 本专利技术进一步的改进在于,通过四叉树法将所述8X8矩阵M8划分为B8U,1}、 B8{1,2}、B8{2,1}和B8{2,2}四个 4X4 块。 阳01引本专利技术进一步的改进在于,将所述8X8矩阵M8划分为B8{1,1}、B8{1,2}、B8{2, 1}和B8 口,2}四个4X4块前还包括:将所述8X8矩阵M8做如下分解: M8"dd为所述8X 8矩阵M8的整数DCT变换单元的0孤分量。[002引本专利技术进一步的改进在于,W所述8X8矩阵M8分解得到的M4作为变换单元,对 所述B8 {1,1}、B8 {1,2}、B8 {2,1}和B8 {2, 2}四个4X4块分别采用公式(1)的蝶形算法进 行整数DCT变换,将所述B8 {1,1}、B8 {1,2}、B8 {2,1}和B8 {2, 2}四个4X4块从时域信号转 换为频域信号; Y8 =X8*M8' (1) 其中,Y8为频域信号,X8为时域信号,M8'为所述8X8矩阵M8的转置矩阵。 本专利技术进一步的改进在于,对所述B8{1,1}、B8{1,2}、B8{2,1}和B8{2,2}四个 4X4块分别采用公式(I)的蝶形算法进行整数DCT变换后,得到公式(2)的矩阵;[00測对公式似的矩阵进行简化,得到公式做的矩阵; 本专利技术进一步的改进在于,将提取的所述数字图像还转化为16X16矩阵M16,通 过W下步骤将完成所述16X16矩阵M16的整数DCT变换: 将所述16X16矩阵M16划分为B16{1,リ、B16{1,2}、B16{2,リ和B16{2,リ四个 8X8 块; 利用经整数DCT变换得到的所述8X8矩阵C8作为变换单元对B16 {1,1}、B16 {1, 2}、B16 {2,1}和B16 {2, 2}四个8X8块分别进行整数DCT变换,得到经整数DCT变换的 C16{1,1}、C16{1,2}、C16{2,1}和C16{2,2}四个 8X8 块;W及 将C16{1,1}、C16{1,2}、C16{2a}和C16{2,2}四个 8X8 块合并得到经整数DCT 变换的16X16矩阵C16,完成所述16X16矩阵M16的整数DCT变换。 本专利技术进一步的改进在于,将提取的所述数字图像还转化为32X32矩阵M32,通 过W下步骤将完成所述32X32矩阵M32的整数DCT变换: 将所述 32X32 矩阵M32划分为B32{1,1}、B32{1,2}、B32{2,1}和B32{2,2}四个 16X16 块; 利用经整数DCT变换得到的所述16X16矩阵C16作为变换单元对B32{1,1}、 B32 {1,2}、B32 {2,1}和B32 {2, 2}四个16X16块分别进行整数DCT变换,得到经整数DCT变 换的C32{1,リ、C32{1,2}、C32{2,リ和C32{2,2}四个16X16块;W及 将C32 {1,1}、C32 {1,2}、C32 {2,1}和C32 {2, 2}四个 16X16 块合并得到经整数DCT 变换的32X32矩阵C32,完成所述32X32矩阵B32的整数DCT变换。 本专利技术由于采用了W上技术方案,使其具有W下有益效果: 采用层次化的整数DCT变换过程,W4X4块为最小变换单元逐步构建8X8的整 数DCT变换单元,并依此方法构建16X16, 32X32的整数DCT变换单元,使现有的计算单元 得到充分利用,缩短了计算时间,并且层次清晰的计算单元更有利于流水线的构建。【附图说明】 图1是目前基于肥VC的整数DCT(30X32)蝶形变换的结构示意图。 图2是本专利技术一种基于肥VC的整数DCT变换方法的整数DCT(8X8)变换的结构 不意图。 图3是本专利技术一种基于肥VC的整数DCT变换方法的整数DCT(16X16)变换的结 构不意图。 W44] 图4是本专利技术一种基于肥VC的整数DCT变换方法的整数DCT(32X3?变换的结 构示意图。【具体实施方式】 下面结合附图及【具体实施方式】对本专利技术作进一步详细的说明。 本发本文档来自技高网
...

【技术保护点】
一种基于HEVC的整数DCT变换方法,其特征在于,包括:输入视频信号;提取所述视频信号中的数字图像;将提取的所述数字图像转化为8×8矩阵M8;将所述8×8矩阵M8划分为B8{1,1}、B8{1,2}、B8{2,1}和B8{2,2}四个4×4块;利用4×4矩阵M4作为变换单元对B8{1,1}、B8{1,2}、B8{2,1}和B8{2,2}四个4×4块分别进行整数DCT变换,得到经整数DCT变换的C8{1,1}、C8{1,2}、C8{2,1}和C8{2,2}四个4×4块;以及将C8{1,1}、C8{1,2}、C8{2,1}和C8{2,2}四个4×4块合并得到经整数DCT变换的8×8矩阵C8,完成所述8×8矩阵M8的整数DCT变换,完成对所述视频信号的时频转换。

【技术特征摘要】

【专利技术属性】
技术研发人员:章旭东诸悦刘行张磊陈晓春刘文庭
申请(专利权)人:上海富瀚微电子股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1