基于扫描线并行RDOQ算法优化的硬件及流水实现方法技术

技术编号:39980563 阅读:28 留言:0更新日期:2024-01-09 01:29
本发明专利技术属于视频编码领域,公开了一种基于扫描线并行RDOQ算法优化的硬件及流水实现方法,本发明专利技术在算法上将最优系数决策的之字形扫描线拆解成多个单向扫描线,以实现并行计算。在最优非零位置决策阶段,将迭代计算拆分成单条扫描线的并行计算,最后对各个扫描线上的最优位置进行RD cost的比较,在保证实时效果良好的前提下,减少迭代的周期,以满足视频编码处理的实时需求。本发明专利技术优化了传统的RD cost计算算法。Rate的强数据依赖使得运算须在单周期内完成,减少了硬件设计中运算的操作数量,节省了资源消耗。本发明专利技术充分利用Distortion无数据依赖的特性将运算拆分到多个流水线中,有效了提高硬件设计的时序表现。

【技术实现步骤摘要】

本专利技术属于视频编码领域,尤其涉及一种基于扫描线并行rdoq算法优化的硬件及流水实现方法。


技术介绍

1、rdoq是avs3视频编码中的一项重要技术,它在提升编码性能方面发挥了重要作用。视频编码中量化的目的是将信号的连续值或大量存在的离散值映射为有限多个离散值来降低码率。因此,量化过程是视频编码中产生失真的主要原因之一,从而影响这编码比特率和视频的失真率。

2、现在对于rdoq的研究主要是对算法的改进主要基于软件层面,由于rdoq的高计算复杂度和对数据的强依赖,使得其在硬件上的实现变得困难。目前还没有一个完整的rdoq硬件实现架构以达到更高的处理速度,且软件算法处理的速度达不到实时处理的要求。

3、(1)传统的最优系数决策过程中采用之字形扫描的算法,硬件设计结构吞吐受限;

4、(2)传统最优系数候选值的rd cost计算复杂度较高且存在强数据依赖,硬件时序较差;

5、(3)最优非零位置决策需迭代计算最优位置,编码实时性较差。


技术实现思路

1、本专利技术目的在本文档来自技高网...

【技术保护点】

1.一种基于扫描线并行RDOQ算法优化的硬件,其特征在于,包含9级流水线S1-S9,其中S1-S2为预量化阶段,S2-S4为OCL决策阶段,S5-S9阶段为LSC决策阶段,S1-S6在持续流水处理变换块,S7-S9阶段等待前W列处理完后再开始进行,所述硬件支持结合多个变换尺寸小于32的变换块以进行同步处理。

2.根据权利要求1所述的基于扫描线并行RDOQ算法优化的硬件的流水实现方法,其特征在于,包括如下步骤:

3.根据权利要求2所述的基于扫描线并行RDOQ算法优化的硬件的流水实现方法,其特征在于,在预量化阶段,所有的变化系数Ci将经历取绝对值,乘积与四舍五入运算,...

【技术特征摘要】

1.一种基于扫描线并行rdoq算法优化的硬件,其特征在于,包含9级流水线s1-s9,其中s1-s2为预量化阶段,s2-s4为ocl决策阶段,s5-s9阶段为lsc决策阶段,s1-s6在持续流水处理变换块,s7-s9阶段等待前w列处理完后再开始进行,所述硬件支持结合多个变换尺寸小于32的变换块以进行同步处理。

2.根据权利要求1所述的基于扫描线并行rdoq算法优化的硬件的流水实现方法,其特征在于,包括如下步骤:

3.根据权利要求2所述的基于扫描线并行rdoq算法优化的硬件的流水实现方法,其特征在于,在预量化阶段,所有的变化系数ci将经历取绝对值,乘积与四舍五入运算,在avs3参考软件hpm-4.0中的除法运算以乘法与移位来替代,运算表达式如下:

4.根据权利要求2所述的基于扫描线并行rdoq算法优化的硬件的流水实现方法,其特征在于,在ocl决策阶段,最优量化系数li*是通过比较每个候选值li的rd cost得到的,其中具有最小cost的候选值作为最优选,ocl步骤的细节如下:

5.根据权利要求4所述的基于扫描线并行rdoq算法优化的硬件的流水实现方法,其特征在于,提出一种基于扫描线的并行ocl决策硬件结构,将原先的zigzag扫描顺序转变成列优先的多个扫描线顺序,进一步又分为右...

【专利技术属性】
技术研发人员:黄晓峰潘锐唐然崔燕唐毅欣周洋陆宇殷海兵
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1