AVS标准中基于并行处理来优化DCT快速算法的方法技术

技术编号：3586034 阅读：222 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供了一种ＡＶＳ标准中基于并行处理来优化ＤＣＴ快速算法的方法，是在ＤＣＴ蝶形快速算法的基础上进行并行优化，通过采用数据对齐，临时数据存储，指令配对，预取数据，对数据进行扩充或者缩减，并且对系数合并相乘等方法步骤，从而进一步提高运算速度，减少占用ＣＰＵ的时间，使得编码器能够实时编码图像。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及信号处理中的音视频编解码
，尤其涉及一种视频编码的AVS标准中基于并行处理来优化DCT快速算法的方法。
技术介绍
近年出现的一批数字音视频编解码标准，具有代表性的有国际标准 H. 264/MPEG-4 AVC,我国自主制定的标准AVS等。AVS标准采用了一系列技术来达到高效率的视频编码，包括帧内预测、帧间预测、DCT(离散余弦变换 Discrete Cosine Transform)变换、量化和熵编码等。帧间预测使用基于块的运动矢量来消除图像间的冗余，帧内预测使用空间预测模式来消除图像内的冗余，再通过对预测残差进行变换和量化消除图像内的视觉冗余，最后，运动矢量、预测模式、量化参数和变换系数用熵编码进行压缩。但是通过 Intel的Vtune (TM) Performance Analyzer性能分析工具可以得到在AVS 编码算法中，DCT模块占用了较多的运算时间。AVS标准中采用的视频基本处理单元是宏块。一个宏块包括一个16x16 的亮度样值块和对应的色度样值块。宏块可进一步划分到最小8x8的样本块来进行预测，所以DCT变换的单元是8x8的残差样值矩阵。如下所示的8x8 的残差样值矩阵H，经过变换变成系数矩阵CoeffMatrix，变换公式如下CoeffMatrix = T8 x H x T8TL是变换矩阵，Tj是Ts的转置矩阵，变换矩阵是AVS标准规定的。<formula>formula see original document page 5</formula>DCT变换就是为了实现上...

【技术保护点】
一种ＡＶＳ标准中基于并行处理来优化ＤＣＴ快速算法的方法，其特征在于，包含以下步骤：步骤１、数据对齐；步骤２、寄存器组被占满的情况下还需要寄存器时的临时数据存储；步骤３、指令配对：同一个周期内完成两条没有冲突的不同指令操作；步骤４、预取数据：在运算前将内存中需要的数据预先取入到高速缓存储器中；步骤５、数据扩充或者缩减；步骤６、系数合并相乘，同时得到不同系数相乘相加的结果；步骤７、并行处理，同时对８×８数据块的一行或者一列数据进行处理。

【技术特征摘要】
1.一种AVS标准中基于并行处理来优化DCT快速算法的方法，其特征在于，包含以下步骤步骤1、数据对齐；步骤2、寄存器组被占满的情况下还需要寄存器时的临时数据存储；步骤3、指令配对同一个周期内完成两条没有冲突的不同指令操作；步骤4、预取数据在运算前将内存中需要的数据预先取入到高速缓存储器中；步骤5、数据扩充或者缩减；步骤6、系数合并相乘，同时得到不同系数相乘相加的结果；步骤7、并行处理，同时对8×8数据块的一行或者一列数据进行处理。2. 如权利要求1所述的AVS标准中基于并行处理来优化DCT快速算法的方法，其特征在于，所述的步骤1包含以下步骤步骤l.l、在一个周期中将数据对齐成整字节的位置，对于128位寄存器需要16字节对齐；步骤1. 2、将8x8的数据块中对齐后的数据逐一取入对应指令的寄存器中。3. 如权利要求1所述的AVS标准中基于并行处理来优化DCT快速算法的方法，其特征在于，所述的步骤2包含以下步骤步骤2.1、划分一...

【专利技术属性】
技术研发人员：陈勇，李国平，
申请(专利权)人：上海广电集团有限公司中央研究院，
类型：发明
国别省市：31[中国|上海]

全部详细技术资料下载我是这个专利的主人