一种图像识别中群相关并行计算的硬件实现方法技术

技术编号:8131235 阅读:267 留言:0更新日期:2012-12-27 03:30
本发明专利技术公开了一种图像识别中群相关并行计算的硬件实现方法,其包括以下步骤:步骤1)设置一个模板的大窗口,所述大窗口将模板中的所有窗口都包罗在内;步骤2)将模板存储器数据通路读出的数据送到所有运算器中;步骤3)各个运算器判断该数据是否属于本运算器负责的窗口中的数据,如果是,则该数据参加运算;如果不是,不预理睬,等待属于它的数据的到来。本发明专利技术在不增加访问存储器通路的情况下大大提高了计算的并行度,提高了计算速度。

【技术实现步骤摘要】

本专利技术涉及计算机技术、图像识别处理
,具体的涉及。
技术介绍
图像识别是一项应用范围很广的技术。在图像识别的各种手段中,图像匹配是最基本的方法。而图像匹配的常用算法是计算两幅图像的相关系数,归一化相关系数的计算公式如下 Σσ,-fy^-g) Coef= I 广- ι.-7)2* JE(Si-S)2V i=lV =1式中η为窗口像素点的个数,f是模板数据,g来自实时图数据,7是模板数据窗口的平均值,I是实时图窗口数据的平均值。具体实施图像匹配计算时经常以窗口为单位,即用实时图的一个窗口与模板的一个窗口做相关系数计算,参见图I所示,Coef数值的大小反映了两个窗口图像的相似度。因为相关计算是以像素为单位的,一幅图像的像素点很多,所以计算量很大。一般为了作出图像识别,一个实时图的窗口往往要与许多模板存储器的窗口做相关计算,即所谓的群相关计算。这里的群是指许多窗口的意思,如图2所示。实时图的一个窗口要与模板中许多同尺寸、但位置不相同的窗口做计算,计算量巨大。用软件做上述计算的耗时是相当大的。
技术实现思路
为克服现有技术中的不足,本专利技术旨在提供,该方法可在不增加访问存储器通路的情况下大大提高群相关计算的速度。为实现上述技术目的,达到上述技术效果,本专利技术通过以下技术方案实现步骤I)设置一个模板的大窗口,所述大窗口将模板中的所有窗口都包罗在内;步骤2)将模板存储器数据通路读出的数据送到所有运算器中;步骤3)各个运算器判断该数据是否属于本运算器负责的窗口中的数据,如果是,则该数据参加运算;如果不是,不预理睬,等待属于它的数据的到来。与现有技术相比,本专利技术具有以下有益效果I、使用两路存储器通道,完成η个窗口的相关计算(或点积计算等其它计算)所需的η个数据,从而大大减少了对存储器数据流量或芯片I/O引脚数的要求;2、多个窗口的计算基本同步并行完成,而不是串行完成,大大提高了计算的并行度,提高了计算速度;3、因为η个窗口是并行执行的,所以芯片内不需要大容量的缓冲器来顺序执行点积或相关计算。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,并可依照说明书的内容予以实施,以下以本专利技术的较佳实施例并配合附图详细说明如后。本专利技术的具体实施方式由以下实施例及其附图详细给出。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中图I表示以窗口为单位的相关比较。图2表示窗口群示意图。图3表示本专利技术的大窗口示意图。图4表示本专利技术的一路模板数据由η个运算器公用的示意图。·具体实施例方式下面将参考附图并结合实施例,来详细说明本专利技术。使用硬件实现群相关计算的目的是为了加速,而加速计算的方法是并行计算。本专利技术采用群内所有模板窗口同时与实时图的一个窗口做计算以实现提速,如此,如果采用η个窗口同时计算的话,那速度就提高η倍了。采用η个运算器同时做计算的一个条件就是要有η个通道读出模板数据。当η较大时,硬件很难实现。比如η = 49,数据宽度为16,按照现在的工艺水平,这是无法实现的。这是群相关并行计算的难点所在。然而,从图2中可以得知,模板中众多窗口大部分区域都是重叠的,所以可充分利用从存储器读出的数据,使读出的数据可以被所有包含它的窗口共同使用。按照上述思想众多模板窗口的数据只用一路存储器读出通道与实时图的一路存储器通道就可以实现所有窗口相关并行计算的需要了。具体实施方法是这样的参见图3及图4所示,,其包括以下步骤步骤I)设置一个模板的大窗口,所述大窗口将模板中的所有窗口都包罗在内;步骤2)将模板存储器数据通路读出的数据送到所有运算器中;步骤3)各个运算器判断该数据是否属于本运算器负责的窗口中的数据,如果是,则该数据参加运算;如果不是,不预理睬,等待属于它的数据的到来。进一步的,本专利技术的实现方法可以用于群相关计算,也可以用于其它计算,如矩阵的加减乘除等计算。以上所述仅为本专利技术的优选实施例而已,并不用于限制本专利技术,对于本领域的技术人员来说,本专利技术可以有各种更改和变化。凡在本专利技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本专利技术的保护范围之内。本文档来自技高网...

【技术保护点】
一种图像识别中群相关并行计算的硬件实现方法,其特征在于,包括以下步骤:步骤1)设置一个模板的大窗口,所述大窗口将模板中的所有窗口都包罗在内;步骤2)将模板存储器数据通路读出的数据送到所有运算器中;步骤3)各个运算器判断该数据是否属于本运算器负责的窗口中的数据,如果是,则该数据参加运算;如果不是,不预理睬,等待属于它的数据的到来。

【技术特征摘要】
1.一种图像识别中群相关并行计算的硬件实现方法,其特征在于,包括以下步骤 步骤I)设置一个模板的大窗口,所述大窗口将模板中的所有窗口都包罗在内; 步骤2)将模板存储器数...

【专利技术属性】
技术研发人员:鞠怡明易凯
申请(专利权)人:苏州科雷芯电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1