面向向量处理器的去均值归一化积相关系数的向量化实现方法技术

技术编号:7256983 阅读:511 留言:0更新日期:2012-04-12 23:23
本发明专利技术公开了一种面向向量处理器的去均值归一化积相关系数的向量化实现方法,包括以下步骤:设基准图A和实时图为B;遍历实时图B,分别计算实时图B中的像素值均值和像素值平方Bij2的累积和;遍历基准图A并每次从基准图A取两个子图Auv和A(u+4)v,通过混洗操作得到4个子图A(u+k)v(k=0,1,2,3);依次计算像素值累计和、(A(u+k)v)ij2的累积和以及(A(u+k)v)ij*Bij的累积和;依次计算出子图A(u+k)v(k=0,1,2,3)分别与实时图B的去均值归一化积相关系数;令u=u+4,重复上述步骤直至遍历完基准图A,可得所有去均值归一化积相关系数值。

【技术实现步骤摘要】

本专利技术涉及图像匹配及其向量化编译领域,特指一种去均值归一化积相关系数的向量化实现方法。
技术介绍
随着4G无线通信、雷达信号处理、高清视频和数字图像处理等计算密集型应用的计算需求越来越高,单芯片难以满足应用需求,多核处理器尤其是其中的向量处理器得到了广泛的应用。向量处理器一般由多个处理器单元(PE)组成,通常支持基于向量的数据加载和存储。每个PE包含独立的多个功能部件,一般包括移位部件、ALU部件、乘法部件等。 向量处理器通常支持SIMD (单指令/多数据)操作,即在同一条向量指令的控制下,所有PE 同时对各自的局部寄存器进行相同操作,用以开发应用程序的数据级并行性。图像匹配处理应用中的许多高密度计算应用,如基于模板的图像匹配往往需要计算基准图像与实时图像的相似度,如差的绝对值和、归一化积相关系数(Normalized Product correlation, Nprod)等,其中去均值归一化积相关系数具有很强的抗噪能力,是图像匹配中应用广泛的相似性准则之一。但是这类高密集运算任务需要将实时图与基准图中的每一个子图逐个进行匹配计算,计算量非常大。在单芯片处理器上通常采用按行、列滑动来推算的快速算法以减少计算量。但是在向量处理器上,这种快速算法不能有效实施。如何充分利用向量处理器大量的计算资源,开发向量处理器的多级并行性,提高向量处理器使用效率,高效的向量化方法是关键。去均值归一化积相关系数计算流程是,设基准图A,其大小为MxN,实时图为B,其大小为mxn,且M > m, N > η ;基准图中以(u,ν)左上角点的子图为Auv,它与实时图B的去均值归一化积相关系数可用下式表示权利要求1.一种,其特征在于包括以下步骤(1)设基准图A,其大小为MxN,实时图为B,其大小为mxn,且M> m,N > η ;向量处理器包括P个处理单元;(2)向量处理器首先遍历实时图B并将实时图B的数据读入向量寄存器,采用基于 SIMD的向量点积操作对处理单元内的值求和,基于归约操作对处理单元间的值求和,分别计算实时图B中的像素值均值云和像素值平方Bij2的累积和;(3)向量处理器遍历基准图A并每次从基准图A取两个头部间隔4个元素且长度均为 4*ρ位的子图Auv和A(u+4)v,通过混洗操作得到4个头部顺序间隔1个元素且长度均为4*p的相邻子图 A(u+k)v(k = 0,1,2,3);(4)采用基于SIMD的向量点积操作对处理单元内的值求和,基于归约操作对处理单元间的值求和,依次计算所述子图A(u+k)v(k = 0,1,2,3)中的所有元素的像素值均值、像素值累计和、像素值平方(Aa^v)i/的累积和、以及基准图A与实时图B的像素值乘积(A(u+k) v) JBij的累积和;(5)依次计算出子图A(u+k)v(k= 0,l,2,3)分别与实时图B的去均值归一化积相关系数 ρ (U, V), P (u+1, V), P (u+2, V), P (u+3, ν);(6)令u= u+4,重复上述步骤(3)到步骤(6)直至遍历完基准图Α,可以计算得到基准图A与实时图B的所有去均值归一化积相关系数值。2.根据权利要求1所述的,其特征在于,所述步骤O)中,所述像素值均值云的计算公式为3.根据权利要求2所述的,其特征在于,所述步骤(4)中,所述像素值均值4.根据权利要求1或2或3所述的,其特征在于,所述步骤(5)中,A(u+k)v(k = 0,1,2,3)与实时图B的去均值归一化积相关系数的计算公式为全文摘要本专利技术公开了一种,包括以下步骤设基准图A和实时图为B;遍历实时图B,分别计算实时图B中的像素值均值和像素值平方Bij2的累积和;遍历基准图A并每次从基准图A取两个子图Auv和A(u+4)v,通过混洗操作得到4个子图A(u+k)v(k=0,1,2,3);依次计算像素值累计和、(A(u+k)v)ij2的累积和以及(A(u+k)v)ij*Bij的累积和;依次计算出子图A(u+k)v(k=0,1,2,3)分别与实时图B的去均值归一化积相关系数;令u=u+4,重复上述步骤直至遍历完基准图A,可得所有去均值归一化积相关系数值。文档编号G06T1/20GK102411773SQ201110213338公开日2012年4月11日 申请日期2011年7月28日 优先权日2011年7月28日专利技术者万江华, 刘仲, 刘衡竹, 孙书为, 彭元喜, 扈啸, 陈书明, 陈海燕, 陈跃跃, 龚国辉 申请人:中国人民解放军国防科学技术大学本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:刘仲陈书明陈跃跃刘衡竹陈海燕龚国辉万江华彭元喜扈啸孙书为
申请(专利权)人:中国人民解放军国防科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术