基于DSP流水结构的快速子像素插值计算方法技术

技术编号：3583656 阅读：253 留言：0更新日期：2012-04-11 18:40

本发明专利技术针对数字视频编码的运动估计中插值计算问题，提出了一种基于ＤＳＰ流水结构的快速子像素插值计算方法，所述方法通过相关性图设计高效的软件流水，并优化内存空间的使用方法和直接内存存取（ＤＭＡ）方法，将数据尽量打包处理，实现高效的软件流水。利用本发明专利技术可以加快子像素插值运算的处理速度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种数字视频编码技术，尤其涉及一种基于DSP流水结构的快速子像素插值计算方法。
技术介绍
现有数字视频编码技术通常采用运动估计来实现帧间压缩编码，在编码的运动估计中，很多像素块其当前点偏离1/2像素点的位置得到的匹配点比整数像素的位置得到的匹配点有更小的残差，由此可知，在一个内插到半像素精度的区域进行搜索可以得到更好的匹配，从而减小码率。进一步地，1/4像素点的插值可以进一步减小码率。事实上，MPEG2编解码标准就有1/2像素插值，到了 H,264和AVS,又增加了 1/4^f象素插值。图1给出了参考图像整数样本、1/2像素样本和1/4像素样本的位置关系，其中大写字母标记的为整数样本位置，灰底色和白底色小写字母分别标记为1/2 像素样本和1/4像素样本位置。1/2像素样本位置的预测值通过4抽头滤波器 Fl[-1，5，5，-1]计算得到。以l/2像素样本b为例，其计算过程如下首先用Fl对水平方向上最近的4个整数样本C、 D、 E和F滤波，得到中间值b'-(-C + 5D + 5E-F);经过饱和运算，最终的预测值b = Clip((b'+ 4) 3) (Clip表示计算结果饱和在(0， 255 )内，>>表示移位)。1/4像素样本位置的预测值通过4抽头滤波器F2[1，7,7， l]计算得到，以1/4 像素样本a为例，其计算过程如下首先用F2在水平方向上对四个样本ee, D, b和E滤波，得到中间值a' = (ee + 7D + 7b + E);经过饱和运算，最终的预测值a = Clip((a'+ 64) 7)。其中e...

【技术保护点】
一种基于ＤＳＰ流水结构的快速子像素插值计算方法，其特征在于，所述方法涉及一个ＤＳＰ芯片的内部寄存器和一个两级存储器，内部寄存器分为Ａ、Ｂ两组，存储器包括一级内存Ｌ１和二级内存Ｌ２；所述插值计算方法包含以下步骤：步骤１、首先由直接内存存取ＤＭＡ从一外存传输数据到Ｌ２中，内部寄存器使用无边界调整双字读取指令ＬＤＮＤＷ和边界调整双字读取指令ＬＤＤＷ向Ｌ１读取数据，Ｌ１接收指令后搜索Ｌ２的原始数据，读取数据到内部寄存器；步骤２、通过低高半字打包指令ＰＡＣＫＬＨ、右移拼接指令ＳＨＲＭＢ、低位打包指令ＰＡＣＫ２和高低半字打包指令ＰＡＣＫＨＬ调整数据在寄存器中的位置，确保数据在合适的位置中；步骤３、使用无符号８位点积指令ＤＯＴＰＵ４在一个时钟周期内实现或执行两个１６位点积指令ＤＯＴＰ２，并将结果求和，在一到两个时钟周期内完成四抽头滤波器的滤波，产生的中间值以３２位的形式存储在寄存器中；步骤４、使用低位打包指令ＰＡＣＫ２将两个３２位的中间值的低１６位打包为一个３２位的值，并将高低１６位分别存储，在打包的同时完成滤波系数的交换；步骤５、使用加法指令ＡＤＤ２和移位指令ＳＨＲ２对寄存器的高低１６位进行加法和...

【技术特征摘要】
1、一种基于DSP流水结构的快速子像素插值计算方法，其特征在于，所述方法涉及一个DSP芯片的内部寄存器和一个两级存储器，内部寄存器分为A、B两组，存储器包括一级内存L1和二级内存L2；所述插值计算方法包含以下步骤步骤1、首先由直接内存存取DMA从一外存传输数据到L2中，内部寄存器使用无边界调整双字读取指令LDNDW和边界调整双字读取指令LDDW向L1读取数据，L1接收指令后搜索L2的原始数据，读取数据到内部寄存器；步骤2、通过低高半字打包指令PACKLH、右移拼接指令SHRMB、低位打包指令PACK2和高低半字打包指令PACKHL调整数据在寄存器中的位置，确保数据在合适的位置中；步骤3、使用无符号8位点积指令DOTPU4在一个时钟周期内实现或执行两个16位点积指令DOTP2，并将结果求和，在一到两个时钟周期内完成四抽头滤波器的滤波，产生的中间值以32位的形式存储在寄存器中；步骤4、使用低位打包指令PACK2将两个32位的中间值的低16位打包为一个32位的值，并将高低16位分别存储，...

【专利技术属性】
技术研发人员：胡书，
申请(专利权)人：上海广电集团有限公司中央研究院，
类型：发明
国别省市：31[中国|上海]

全部详细技术资料下载我是这个专利的主人