可缩放大规模二维卷积电路制造技术

技术编号:2947297 阅读:190 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种可缩放大规模二维卷积电路,该电路包括一个基准图像素寄存器Y,一个实时图像素寄存器组X,由128个的阵列乘法器M↓[0],M↓[1],.....M↓[127]组成的乘法器组,由128个寄存器p↓[0],p↓[1],....p↓[127]组成的乘积寄存器组,由128个加法器A↓[0],A↓[1],......A↓[127]构成的加法器组,由128个寄存器S↓[0],S↓[1],.....S↓[127]组成的中间结果寄存器组,一个输出电路,用于计算结果的三态输出;一个用于产生时钟、读写、片选以及清除信号的控制电路。该电路在计算时,算法中运算量大、规则性强的计算由卷积电路完成,微处理器负责存储采集的图像数据,并运算其他并行性较差、无规则的计算,把微处理器的灵活性与硬件电路的高速性有机的结合起来,达到灵活、高适应性和高实时性的效果,能够大幅提高处理速度,又确保可靠性。

【技术实现步骤摘要】

本专利技术属于嵌入式计算机高速协处理部件,涉及一种可缩放大规模二维卷积电路,用于大幅提高嵌入式计算机在进行图像匹配时的计算速度。
技术介绍
现有技术在进行图像匹配计算时,都是用微处理器(包括DSP微处理器)进行的,由于计算量大,单个微处理器(DSP)达不到实时性要求,为加快计算速度,用多个微处理器(DSP)来并行计算,但这增加了体积、功耗,也降低了可靠性,满足不了嵌入式应用要求。
技术实现思路
针对上述现有技术存在的缺陷与不足,本专利技术的目的在于,提供一种可缩放大规模二维卷积电路,该电路在嵌入式条件下,能够大幅提高处理速度,既提高了实时性,又确保可靠性,而且具有较广的应用范围。为了实现上述任务,本专利技术采取如下的技术解决方案一种可缩放大规模二维卷积电路,其特征在于面向算法设计,充分挖掘算法中的并行性特点,应用资源重复与时间重叠技术,用硬件电路直接完成计算;同时可根据计算环境的变化,缩放计算规模。电路包括一个基准图像素寄存器Y,数据宽度为8位;一个实时图像素寄存器组X,数据宽度为8位,由128个8位寄存器x0~x127构成移位寄存器,其寄存器x0的输出接至片外,以备级连时连接,X值以串行方式移入寄存器组;乘法器组,由128个的阵列乘法器M0,M1,.....M127组成,每一个乘法器Mi的两个输入,来自基准图像素寄存器Y和对应的实时图像素寄存器xi; 乘积寄存器组,由128个寄存器p0,p1,....p127组成,数据宽度为16位,寄存器pi输入接相应乘法器Mi输出;加法器组,由128个加法器A0,A1,......A127构成,每个加法器Ai的两个输入来自相应的乘积寄存器pi和中间结果寄存器Si-1;中间结果寄存器组,由128个寄存器S0,S1,.....S127组成,数据宽度16~26位,每个中间结果寄存器Si用于暂存相应加法器Ai的和;一个输出电路,用于计算结果的三态输出,以便与CPU的总线相连;一个控制电路,用于产生时钟、读写、片选以及清除信号。本专利技术的可缩放大规模二维卷积电路,可在一个时钟周期同时实现128对像素值的乘累加,即完成计算R=Σi=07Σj=015xijyij,]]>若用微处理器计算,需要进行128次乘操作和127次加操作,共255次操作,但用本专利技术的卷积电路计算时,当流水建立后,只要一次操作就可完成。本专利技术的可缩放大规模二维卷积器电路,在计算时,算法中运算量大、规则性强的计算由卷积电路完成,微处理器负责存储采集的图像数据,并运算其他并行性较差、无规则的计算,把微处理器的灵活性与硬件电路的高速性有机的结合起来,达到灵活、高适应性和高实时性的效果。附图说明图1是本专利技术的大规模二维卷积器电路结构图;图2是卷积单元电路图;图3是编程控制图;图4是卷积器用于信号处理的信号处理单元结构。以下结合附图和专利技术人给出的实施例对本专利技术作进一步的详细说明。具体实施例方式在图像匹配等图像处理算法中,经常要计算如下的公式 R=Σi=0M-1Σj=0N-1xijyij]]>当M和N很大时,计算量很大,但由于图像匹配等图像处理算法具有规则性强、并行性好等特点,可用硬件电路直接实现,省去用微处理器计算时程序执行时间的约束,从而提高处理速度。卷积电路充分挖掘算法中的流水和并行特性,充分运用时间重叠和资源重复技术,使电路具有流水和并行计算能力,同时为了扩大运用范围,能进行平滑、滤波等计算,使电路可通过编程控制,实现规模可缩放。(1)、电路结构电路结构如图1所示,其组成为a、一个基准图像素寄存器Y,数据宽度为8位;b、一个实时图像素寄存器组X,数据宽度为8位。由128个8位寄存器x0~x127构成移位寄存器。其寄存器x0的输出接至片外,以备级连时连接。X值以串行方式移入寄存器组;c、乘法器组由128个的阵列乘法器组成M0,M1,.....M127,每一个乘法器Mi的两个输入,来自基准图像素寄存器Y和对应的实时图像素寄存器xid、乘积寄存器组,由128个寄存器组成p0,p1....p127,数据宽度为16位,寄存器pi输入接相应乘法器Mi输出;e、加法器组由128个加法器构成A0,A1......A127,每个加法器Ai的两个输入来自相应的乘积寄存器pi和中间结果寄存器Si-1;f、中间结果寄存器组,由128个寄存器组成S0S1.....S128。数据宽度16~26位,每个中间结果寄存器Si用于暂存相应加法器Ai的和;g、输出电路三态输出;h、控制电路产生时钟(CLK),读写(R/W),和片选(CS)以及清除(RESET)信号。由电路结构可看出,整个电路实质上是由一个个基本卷积单元串连构成的。基本卷积单元由一个实时图寄存器、一个像素对乘法器、一个像素对乘寄存器、一个加法器和一个中间结果寄存器构成。如图2所示,每一基本单元实现Si-1+xiyi,128点卷积电路是由128个基本单元直接串连起来,再连接Y寄存器,控制电路和三态门。整个电路结构规整,简单、易于设计实现。(2)、电路工作过程1)、将所有寄存器复位;2)、先将128个X值x0~x127串行移入X寄存器组,然后将Y值依次移入Y寄存器;3)、移入第一个Y值后,第130个脉冲将第一个卷积结果置入S127。实现s127=Σi=0127xiyi+u]]>u=0,1,…,m此后,每移入一个Y值,S127中置入一个卷积结果,即每个时钟周期获得一个128对像素值的乘累加结果,这些结果按顺序分别对应u=0,1,…,m。(3)、电路特点1)、结构规整由一个个基本单元串联而成,便于设计和实现;2)、级连方便灵活可根据需要级连,增大计算规模,提高计算速度;3)、卷积规模大,计算速度快;4)、电路采用了多种并行技术 资源重复技术128个相同的乘法器,128个相同的加法器,128个乘积寄存器和128个中间结果寄存器同时工作。时间重叠技术乘和加及多级加之间采用时间重叠,流水操作。(4)计算规模可编程性为使电路规模可缩放,从而适应计算环境的变化,可通过级连来扩大计算规模,通过编程来控制计算规模的变化,如在滤波、平滑等的3×3、5×5、7×7模板等,编程控制如图3所示。编码与计算规模对应关系如下 (5)实现方案设计成IP核,用FPGA实现。专利技术带来的技术效果是1、可在一个时钟周期同时实现128对像素值的乘累加,即完成计算R=Σi=07Σj=015xijyij,]]>若用微处理器计算,需要进行128次乘操作和127次加操作,共255次操作,但用本专利技术的卷积器计算时,当流水建立后,只要一次操作就完成了。2、用DSP做主处理器,可缩放大规模二维卷积器做快速协助处理部件的信号处理单元处理速度估计信号处理单元由DSPTMS320C6701和算法硬件构成。因为图像匹配的计算量很大。用进行图像匹配计算来估算信号处理单元的处理速度。图像匹配计算中乘累加运算占总计算量的80%以上,可以用乘累加运算来估算。以128对象素值的乘加运算为例来说明。128对象素值的乘累加运算要进行128次乘操作和127次加操作。共255次操作。用TMS本文档来自技高网...

【技术保护点】
一种可缩放大规模二维卷积电路,其特征在于,该电路包括:一个基准图像素寄存器Y,数据宽度为8位;一个实时图像素寄存器组X,数据宽度为8位,由128个8位寄存器x↓[0]~x↓[127]构成移位寄存器,其寄存器x↓[0]的输出接 至片外,以备级连时连接,X值以串行方式移入寄存器组;乘法器组,由128个的阵列乘法器M↓[0],M↓[1],……M↓[127]组成,每一个乘法器M↓[i]的两个输入,来自基准图像素寄存器Y和对应的实时图像素寄存器x↓[i]; 乘积寄存器组,由128个寄存器p↓[0],p↓[1],……p↓[127]组成,数据宽度为16位,寄存器p↓[i]输入接相应乘法器M↓[i]输出;加法器组,由128个加法器A↓[0],A↓[1],……A↓[127]构成,每个加法器A↓ [i]的两个输入来自相应的乘积寄存器p↓[i]和中间结果寄存器s↓[i-1];中间结果寄存器组,由128个寄存器s↓[0],s↓[1],……s↓[127]组成,数据宽度16~26位,每个中间结果寄存器s↓[i]用于暂存相应加法器A↓ [i]的和;一个输出电路,用于计算结果的三态输出,以便与CPU的总线相连;一个控制电路,用于产生时钟、读写、片选以及清除信号。...

【技术特征摘要】

【专利技术属性】
技术研发人员:黄士坦刘红侠
申请(专利权)人:中国航天时代电子公司第七七一研究所
类型:发明
国别省市:87[中国|西安]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1