The invention provides a fast calculating method based on FPGA to realize the related algorithm. The searching window data needed to read m times matching is calculated by one time matching. The matching calculation of the searching window data read is carried out in parallel according to m channels, and M is a multiple of 2. The invention reads the search window data needed for m-times matching by one matching calculation, and the latter matching calculation is carried out in parallel according to m-way, thus completing m-times matching by one matching calculation. Secondly, because the matching calculation cycle of correlation calculation is many, a lot of time is wasted on data moving, so the invention enlarges the data bit width by changing one data moving to one moving M data moving at a time. Data, shorten the moving time. The invention realizes the fast calculation of the related algorithm, and improves (m*m) times the traditional calculation speed.
【技术实现步骤摘要】
一种基于FPGA实现相关算法的快速计算方法
本专利技术涉及相关跟踪,具体为一种基于FPGA实现相关算法的快速计算方法。
技术介绍
相关跟踪是将场景图像数字化后,利用现场图像与前一时刻所选定的样板图像的相关函数来确定两个图像的最佳匹配位置,从而确定目标位置。基于图像匹配的相关跟踪的缺点是数据量大,运算复杂,不易达到大窗口实时处理的要求,例如,当模板大小为M×M像素,搜索窗大小为N×N像素时,在一场的时间里需要完成(N-M+1)×(N-M+1)次匹配计算,可以看出计算量随着搜索窗的增大而呈平方增长。搜索窗的大小将直接影响图像跟踪器能够适应的环境和跟踪目标类型等系统性能,因此当跟踪窗比较大时,系统对硬件的要求也就相对较高。
技术实现思路
针对现有技术中存在的问题,本专利技术提供一种基于FPGA实现相关算法的快速计算方法,大大提高了计算速度。本专利技术是通过以下技术方案来实现:一种基于FPGA实现相关算法的快速计算方法,一次匹配计算读取m次匹配所需的搜索窗数据,所读取的搜索窗数据的匹配计算按照m路并行进行,m为2的倍数。优选的,m为2、4或8。优选的,具体包括如下步骤:步骤1,首先外部搜索窗数据输入到搜索窗缓冲区BRAM中,控制读取搜索窗n×(n+1)矩阵数据,其中n为2的倍数;搜索窗n×(n+1)矩阵数据分成m路搜索窗n×n矩阵数据,然后m路搜索窗n×n矩阵数据分别进行求均值运算并保存结果为sub_aver;外部模板窗数据输入到模板窗缓冲区BRAM中,控制读取模板窗n×n矩阵数据,然后进行求均值运算并保存结果为mb_aver;步骤2,读取搜索窗n×(n+1)矩阵数据 ...
【技术保护点】
1.一种基于FPGA实现相关算法的快速计算方法,其特征在于,一次匹配计算读取m次匹配所需的搜索窗数据,所读取的搜索窗数据的匹配计算按照m路并行进行,m为2的倍数。
【技术特征摘要】
1.一种基于FPGA实现相关算法的快速计算方法,其特征在于,一次匹配计算读取m次匹配所需的搜索窗数据,所读取的搜索窗数据的匹配计算按照m路并行进行,m为2的倍数。2.根据权利要求1所述的基于FPGA实现相关算法的快速计算方法,其特征在于,m为2、4或8。3.根据权利要求1所述的基于FPGA实现相关算法的快速计算方法,其特征在于,具体包括如下步骤:步骤1,首先外部搜索窗数据输入到搜索窗缓冲区BRAM中,控制读取搜索窗n×(n+1)矩阵数据,其中n为2的倍数;搜索窗n×(n+1)矩阵数据分成m路搜索窗n×n矩阵数据,然后m路搜索窗n×n矩阵数据分别进行求均值运算并保存结果为sub_aver;外部模板窗数据输入到模板窗缓冲区BRAM中,控制读取模板窗n×n矩阵数据,然后进行求均值运算并保存结果为mb_aver;步骤2,读取搜索窗n×(n+1)矩阵数据并分成m路搜索窗n×n矩阵数据,然后m路搜索窗n×n矩阵数据减各自的均值后得到m路数据sub_reduce_aver,m路数据sub_reduce_aver并行进行平方和开根号运算得到m路数据sub_sqrt;读取模板窗n×n矩阵数据,然后减去均值mb_aver后得到数据mb_reduce_aver并行进行平方和开根号运算得到数据mb_sqrt;m路数据s...
【专利技术属性】
技术研发人员:付小伟,
申请(专利权)人:西安思丹德信息技术有限公司,
类型:发明
国别省市:陕西,61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。