【技术实现步骤摘要】
【国外来华专利技术】用于基于GPU的解块的高并行依赖性模式
技术介绍
VP9是Google所提出的领先视频压缩标准,其在互联网媒体应用(包括流播视频和视频会议)上经历着日益增长的普及。VP9致力于64×64像素的超级块。VP9的解块模块通过首先对垂直边缘并且其次对水平边缘进行滤波(filtering),来减少超级块上的块状伪像。VP9的解块模块因其对近邻结果的高依赖性而在传统软件实现中消耗计算成本的大部分。更具体来说,线程在能够使用由那些邻近线程进行的执行的结果来完成执行之前需要等待邻近块的线程的执行。采用传统图形处理单元(GPU)实现,计算并行效率由于VP9解块模块的新空间依赖性模式而是非常差的。附图说明关于下列的图来描述一些实施例:图1示出按照一个实施例的波前26依赖性;图2示出按照一个实施例的超级块的解块边缘及其最靠近的近邻;图3示出按照一个实施例的用于各边缘的依赖性模式;图4示出按照一个实施例、分裂成128个较小线程的64×64像素超级块;图5示出用于一个实施例的七个依赖性候选;图6示出按照一个实施例、具有变换单元(TU)大小信息的依赖性插图;图7是用于一个实施例的流程图;图8是用 ...
【技术保护点】
一种方法,包括:通过将用于整个块的较大内核程序分裂成具有较少依赖性的较小部分来执行用于视频压缩的解块;以及通过消除不必要的依赖性来减少用于给定线程的依赖性的数量。
【技术特征摘要】
【国外来华专利技术】2014.12.10 US 14/565,5551.一种方法,包括:通过将用于整个块的较大内核程序分裂成具有较少依赖性的较小部分来执行用于视频压缩的解块;以及通过消除不必要的依赖性来减少用于给定线程的依赖性的数量。2.如权利要求1所述的方法,包括使用与用于视频压缩的块大小的行数量加上该块大小的列数量相等的线程数量。3.如权利要求1所述的方法,包括基于所述块内的像素位点来减少不需要的依赖性。4.如权利要求1所述的方法,包括基于变换单元大小来减少不需要的依赖性。5.如权利要求1所述的方法,包括使用64×64像素或更大的块大小。6.如权利要求1所述的方法,包括每线程指派七个依赖性,以及然后尝试减少依赖性的数量。7.如权利要求6所述的方法,包括将七个依赖性指派给当前线程左边的两个线程、所述当前线程右边的一个线程、所述当前线程上方的三个线程、以及在所述当前线程下方且在所述当前线程左边的一个线程。8.一种设备,包括:处理器,用来通过将用于整个块的较大内核程序分裂成具有较少依赖性的较小部分来执行...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。