一种低复杂度整数4×4离散余弦变换量化实现方法技术

技术编号:3607549 阅读:254 留言:0更新日期:2012-04-11 18:40
本发明专利技术是一种低复杂度整数4×4离散余弦变换量化装置及其实现方法,包括帧内预测模块、熵编码模块、环形滤波电路、帧缓存、用于进行行列变换的正变换模块、用于对正变换模块输出的变换矩阵进行归一化处理的缩放模块、量化模块、反量化模块、反变换模块。正变换模块对帧内或帧间预测的图像块残差系数矩阵做整数4×4离散余弦变换;缩放模块对正变换后的矩阵的模进行归一化处理;右移变换矩阵运算位,将运算位限制在一定位数之内;量化模块用一个一维数组对经过缩放的变换矩阵进行量化;反量化模块对量化后的变换矩阵进行反量化;反变换模块对反量化后的矩阵的列和行进行反变换。本发明专利技术克服了数据漂移、编解码端不匹配等问题,降低了运算复杂度。

【技术实现步骤摘要】

本专利技术属于数字电视图像处理中数字视频的编解码技术和芯上系统(SOC,System on Chip)
,尤其是涉及。
技术介绍
高效的视频编解码技术是实现多媒体数据存储与传输的关键,先进的视频编解码技术通常以标准的形式进行规定。目前,典型的视频压缩标准有国际标准化组织(ISO)下设的运动图像专家组(MPEG,Moving Picture Expert Group)推出的系列国际标准,国际电信联盟(ITU)提出的国际电信联盟最新视频编解码标准H.26x系列视频压缩标准,以及ISO和ITU建立的联合视频工作组JVT(Joint VideoTeam)正在制定的JVT视频编码标准等。JVT标准采用的是一种新型的编码技术,它比现存的任何一种编码标准的压缩效率都高的多。JVT标准在ISO中的正式名称是MPEG-4标准的第十部分,在ITU中的正式名称是H.264标准。变换和量化是实现视频编、解码的关键技术,如果没有变换和量化,任何视频编、解码标准的应用都几乎是不可能的。引入变换的根本原因就是提高压缩效率,(上述标准和相关的现有技术中关于技术变换和量化技术的出处、技术状况和存在的主要问题是什么?)由于离散余弦变换(DCT)最接近卡文罗夫(Karhunen-Loeve)变换,所以目前国际通用的图像和视频压缩编解码标准几乎都采用了这种变换方法,但这种传统的DCT变换方法中存在数据飘移问题,造成编、解码端的不匹配,从算法上看,采用乘法,使得硬件实现和应用复杂和困难,复杂度较高。在最新H.264/AVC建议/标准中则采用了类似于DCT的整数4×4变换,但是,H.264/AVC中所采用的整数4×4变换阵,它的每行的绝对值的和不相等,而且每行的模相差很大,这就不利于将解码端的缩放放到编码端进行,不能减少解码端的运算复杂度和解码的时间开销;另外,在H.264/AVC中所采用的量化方法,量化和反量化分别使用了6个2维4×4表,读取量化表和反量化表的时间开销以及数据的存储开销都较大。
技术实现思路
为了克服上述现有技术的不足,本专利技术的目的在于提供,使DCT变换中浮点运算编码端和解码端相匹配。本专利技术的另一个目的在于提供,降低变换的运算复杂度。为了完成上述专利技术任务,本专利技术采用的总体技术方案是一种低复杂度整数4×4离散余弦变换量化装置,包括帧内预测模块、熵编码模块、环形滤波电路、帧缓存,还包括正变换模块,用于对帧内预测或帧间预测模块产生的残差系数矩阵进行4×4行列变换,其输入端连接运动补偿预测或帧内预测模块的输出端,输出端连接缩放模块;缩放模块,用于对正变换模块输出的变换矩阵进行统一归一化处理; 量化模块,用于将缩放后得到的中间结果矩阵进行量化,其输出端连接缩放模块的输入端和熵编码模块;反量化模块,用于将量化后矩阵反量化,反量化模块输入端与缩放模块缩放输出端连接,其反量化矩阵输出端与反变换模块的输入端连接;反变换模块,用于对反量化输出的图像参数矩阵反变换,反变换模块输出端连接到环形滤波和帧缓存。一种低复杂度整数4×4离散余弦变换量化实现方法,包括以下步骤步骤1正变换模块对帧内预测或帧间预测残差矩阵做水平方向整数4×4离散余弦行变换,并做竖直方向列变换;步骤2缩放模块对正变换模块变换后的矩阵的模进行归一化处理;步骤3缩放模块将经归一化处理后得到的结果矩阵的运算位右移,并将运算位限制在一定位数之内;步骤4量化模块在编码端和解码端用一个一维数组对经过缩放的变换矩阵进行量化,并向熵编码模块输出量化后的结果矩阵;步骤5反量化模块在编码端和解码端用一个一维数组对量化后的变换矩阵进行反量化;步骤6反变换模块对反量化后的矩阵的列和行进行反变换。所述步骤1进一步包括步骤11、正变换模块接收帧内预测和帧间预测模块残差系数矩阵;步骤12、正变换模块将核心变换矩阵分解为相乘的两个矩阵,用第一个矩阵左乘图像参数残差矩阵,再用第二个矩阵左乘第一个矩阵左乘图像预测残差系数矩阵后的矩阵,得到中间结果矩阵;步骤13、正变换模块将得到的中间结果矩阵右乘第一个矩阵的转秩矩阵,再将右乘得到的矩阵右乘第二个矩阵;步骤14、正变换模块将正变换结果矩阵输出到缩放模块。所述步骤11中的核心变换矩阵为222231-1-32-2-2-21-33-1]]>所述步骤12中的第一个矩阵和第二个矩阵为第一个矩阵220000132-20000-31]]>第二个矩阵1001011001-10100-1]]>所述步骤1中的水平方向整数4×4变换后的每一行运算位为12位,它包括变换矩阵的行位数3位和残差位数9位。所述步骤1中竖直方向列变换后运算位为15位。所述步骤2中对变化后的矩阵的模进行统一的归一化处理具体为将组成矩阵的各元素分别去除它所在的行或列的各个元素经平方再开方的值,使每一行或列的模都等于1。所述步骤3中的运算位限制位数为16位。所述步骤4中的量化具体包括步骤41、针对某一量化步长,根据公式Q(i)=32768/2i/8确定其相对应的量化参数,并保存在一个一维的量化表中; 步骤42、将经过缩放处理后所得到的中间结果矩阵Y’乘以相对应的量化参数;步骤43、再将上述结果矩阵的运算位右移,使得最终的结果矩阵运算位保持在16位以下。所述步骤5中的反量化的步骤具体包括步骤51、针对量化时所采用的某一量化步长,根据公式IQ_TAB=32768×2qp/8确定其相对应的反量化参数,并保存在一个一维的反量化表中;步骤52、将经过熵解码处理后所得到的量化矩阵Y”乘以相对应的反量化参数;步骤53、再将上述结果矩阵运算位右移,使得最终的结果矩阵的运算位保持在16位以下。所述步骤6中的反变换具体包括以下步骤步骤61、反变换模块将核心变换矩阵的转秩矩阵分解为两个相乘的第一矩阵转秩矩阵和第二矩阵转秩矩阵,用第二矩阵转秩矩阵左乘反量化后的矩阵,再用第一矩阵转秩矩阵左乘得到的矩阵,得到乘积矩阵;步骤62、反变换模块将得到的上述乘积矩阵的转秩矩阵再右乘第二矩阵和第一矩阵,得到最后的结果矩阵。本专利技术有显著的优点和积极效果,本专利技术采用不同于现有技术的的核心变换矩阵,对变换矩阵中每行的模作了归一化处理,采用整数4×4离散余弦变换阵,每行的绝对值的和都等于8,第一、三行的模为 第二、四行的模等于 相差很小,有利于将解码端的缩放放到编码端进行,减少了解码端的运算复杂度和解码的时间开销,因此,在量化端和反量化端分别只需要一个一维数组即可完成不同级别的量化、反量化,这就使得量化和反量化所需的存储空间大大降低,大大减少了时间开销和存储开销。本专利技术在性能上克服了传统的DCT变换方法中存在的数据飘移的缺陷,避免了编、解码端不匹配的问题,在方法,本专利技术用3以内的系数矩阵实现低复杂度、低存储开销的整数变换,使得软件与硬件的实现复杂度均较低。完全取消了乘法,只采用加法和移位,使得硬件实现和应用更加方便和容易,并将计算结果限制在16Bit之内,降低了运算复杂度,尤其适合低端处理器。附图说明图1是本专利技术的主要功能模块图;图2是本专利技术的方法流程图;图3是正变换快速DCT计算示意图;图4是反变换快速DCT计算示意图。具体实施例方式下面结合附图和具体实施方式对本专利技术作进一步详细的说明。请参阅图1,本专利技术的一种低复杂度整数离散余本文档来自技高网
...

【技术保护点】
一种低复杂度整数4×4离散余弦变换量化装置,包括帧内预测模块、熵编码模块、环形滤波电路、帧缓存,其特征在于,该装置还包括:    正变换模块,用于对帧内预测或帧间预测模块产生的残差系数矩阵进行4×4行列变换,其输入端连接运动补偿预测或帧内预测模块存储残差的残差数据矩阵输出端,输出端连接缩放模块;    缩放模块,用于对正变换模块输出的变换矩阵进行统一归一化处理;    量化模块,用于将缩放后得到的中间结果矩阵进行量化,其输出端连接缩放模块的输入端和熵编码模块;    反量化模块,用于将量化后矩阵反量化,反量化模块输入端与缩放模块缩放输出端连接,其反量化矩阵输出端与反变换模块的输入端连接;    反变换模块,用于对反量化输出的图像参数矩阵反变换,反变换模块输出端连接到环形滤波和帧缓存。

【技术特征摘要】

【专利技术属性】
技术研发人员:高文赵德斌马思伟郑玉
申请(专利权)人:联合信源数字音视频技术北京有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1