一种基于光电计算阵列的矩阵向量乘法器的运算优化方法技术

技术编号:22167168 阅读:39 留言:0更新日期:2019-09-21 10:41
本发明专利技术公开了一种基于光电计算阵列的矩阵向量乘法器的运算优化方法。该方法对于带负数的矩阵,首先给矩阵中的每一个数都加上一个零点值,使得矩阵中不再含有负数;然后在矩阵中再添加一列为第一列,并且此列的每一个值均为零点值,得到修正后的矩阵,其中零点值为某一固定位宽下的数据下限的绝对值;对修正后的矩阵进行矩阵向量乘运算后得到中间结果向量,对于此中间结果向量,将除第一列外的所有列的结果减去第一列的结果,即得到最终结果向量。本发明专利技术的优化方法可以避免负数矩阵的使用,节省一半的面积和功耗。

An Operational Optimization Method of Matrix Vector Multiplier Based on Photoelectric Computing Array

【技术实现步骤摘要】
一种基于光电计算阵列的矩阵向量乘法器的运算优化方法
本专利技术涉及一种基于光电计算阵列的矩阵向量乘法器运算优化方法,属于计算领域和光电探测领域。
技术介绍
传统的计算机大多采取冯诺依曼架构,然而,因为冯诺依曼架构存储单元和运算单元的分立,导致了在数据传输上产生了极大的能量消耗,并且影响运算速度。光电计算单元为一种可以独立运算或者与目前电子计算技术相结合来进行运算的计算器件,其特点为:单器件即可实现“存-算一体功能”、集成度好、能效比高、兼容性强,因此非常适合加速以神经网络算法、CT算法为代表的一系列需要大量运算矩阵向量乘法的算法。矩阵向量乘运算如果在采用冯诺依曼架构的硬件上运行,比如CPU、GPU、FPGA,则需要大量的数据传输过程,对于规模很大的矩阵,计算速度比数据传输的速度要快得多,优化计算速度不能够加快整个系统的速度。如果矩阵向量乘运算在非冯架构上运行,比如忆阻器阵列RRAM,虽然解决了之前的问题,但是生产工艺良率低,阵列的规模较小。此外,在矩阵向量乘运算中,对于矩阵系数为负数的情况,以忆阻器阵列为例,通常的处理办法是采用正负矩阵的方法,将原有的系数矩阵拆分为正矩阵和负矩阵,分别进行矩阵向量乘运算,再将两个结果向量相减,但这样所消耗的运算阵列就是原本的2倍。
技术实现思路
为了克服以上现有技术中存在的缺陷,本专利技术提供一种基于光电计算阵列的矩阵向量乘法器的运算优化方法。本专利技术采用的技术方案如下:一种基于光电计算阵列的矩阵向量乘法器的运算优化方法,其特征在于,光电计算阵列由多个光电计算单元周期性排列组成,每个光电计算单元包括发光单元和计算单元,发光单元发出的光入射到计算单元中;每个计算单元包括载流子控制区、耦合区、以及光生载流子收集区和读出区;所述运算优化方法的具体步骤如下:(1)将光电计算单元排列成m行和n+1列的阵列,其中,m为待乘矩阵的行数,n为待乘矩阵的列数;阵列中,每一列计算单元的光生载流子收集区和读出区中的读出区依次相连,每一行计算单元的载流子控制区依次相连;(2)采用零点列法对所述待乘矩阵进行修正:对于所述待乘矩阵中的负数矩阵,首先给矩阵中的每一个数都加上一个零点值,使得矩阵中不再含有负数;然后在矩阵中再添加一列为第一列,并且此列的每一个值均为零点值,得到修正后的矩阵,其中零点值为某一固定位宽下的数据下限的绝对值;(3)所述发光单元发出被设置为修正后的矩阵中数据的光信号,并入射到对应的计算单元的光生载流子收集区和读出区,为矩阵向量乘法器的矩阵数据输入端;每一行计算单元的载流子控制区输入被设置为代表向量中各个元素的载流子,为矩阵向量乘法器的向量数据输入端;其中,所述向量中各个元素的数据被转化为二进制后,按照比特位串行地将代表二值化后数据的载流子输入到各个行的载流子控制区中;(4)计算单元的光生载流子收集区和读出区中的读出区输出端输出受矩阵数据和向量数据共同作用后的载流子,并在固定电压的驱动下以电流的形式输出,电流信号按列汇聚后经过AD转换,按输入的比特位进行移位操作然后累加,得到中间结果向量;(5)对于得到的中间结果向量,用数字减法器将从第二列开始的每一列结果均减去第一列的结果,即得到最终结果向量。进一步地,所述光电计算单元的数量大于等于六个。进一步地,由多个所述光电计算阵列组成并行矩阵向量乘法器,所述光电计算阵列的个数和向量中元素的位宽相等。进一步地,所述步骤(4)中,每一列计算单元输出的电流信号分别输入到一个模数转换器中,或者多列计算单元输出的电流信号共同输入到一个模数转换器。本专利技术基于光电计算阵列提出了一种零点列法的矩阵向量乘法器运算优化方法,即对于负数矩阵权值的计算,通过添加零点列的方式,避免了负数矩阵的使用,从而在完成原有计算任务的基础下,可以减少一半的光电计算阵列,即节省一半的面积和功耗。附图说明图1是计算单元的多功能区框图。图2是光电计算阵列的结构示意图,其中:1-发光阵列,2-计算阵列。图3是实施例1计算单元结构的(a)截面图和(b)立体图。图4是实施例2计算单元结构的(a)截面图和(b)立体图。图5是实施例3计算单元的(a)结构示意图和(b)多功能区示意图。图6是零点列串行矩阵向量乘法器的框图。图7是零点列法处理中间结果向量的计算示意图。图8是零点列并行矩阵向量乘法器的计算示意图。图9是零点列并行矩阵向量乘法器的框图。具体实施方式本专利技术光电计算单元中的计算单元为包括三大功能区的多功能区结构,如图1所示,三大功能区为:载流子控制区、耦合区、光生载流子收集区和读出区,具体功能分别如下:载流子控制区:负责控制并调制光电计算单元内的载流子,并且作为计算单元的电输入端口,输入其中一个运算量作为电输入量;或者只控制并调制计算单元内的载流子,通过其他区域输入电输入量。耦合区:负责连接光生载流子收集区和读出区,使得光子入射产生的光生载流子作用于光电计算单元内的载流子,形成运算关系。光生载流子收集区和读出区:其中收集区负责吸收入射的光子并收集产生的光生载流子,并且作为计算单元的光输入端口,输入其中一个运算量作为光输入量;读出区可以作为计算单元的电输入端口,输入其中一个运算量作为电输入量,并且作为计算单元的输出端口,输出被光输入量和电输入量作用后的载流子作为单元输出量;或者通过其他区域输入电输入量,读出区只作为计算单元的输出端口,输出被光输入量和电输入量作用后的载流子,作为单元输出量。发光单元发出的光作为入射计算单元光生载流子收集和读出区的光子,参与运算。光电计算阵列包括发光阵列1和计算阵列2,结构如图2所示。发光阵列1由多个发光单元周期性排列组成,计算阵列2由多个计算单元周期性排列组成。实施例1如图3所示,本实施例的计算单元包括:作为载流子控制区的控制栅极、作为耦合区的电荷耦合层,以及作为光生载流子收集区和读出区的P型衬底,P型衬底中分为左侧收集区和右侧读出区,其中右侧读出区中包括浅槽隔离、通过离子注入形成的N型源端和N型漏端。浅槽隔离位于半导体衬底中部、收集区和读出区的中间,浅槽隔离通过刻蚀并填充入二氧化硅来形成,以用于隔离收集区和读出区的电信号。N型源端位于读出区内靠近底层介质层的一侧,通过离子注入法掺杂而形成。N型漏端位于半导体衬底中靠近底层介质层与N型源端相对的另一侧,同样通过离子注入法进行掺杂法形成。应理解,本文中提及的左侧、右侧、上方以及下方只代表在通过图中所示视角观察下的相对位置随观察视角变化而变化,并不理解为对具体结构的限制。在收集区的衬底上施加一个电压范围为负压的脉冲,或在控制栅上施加一个电压范围为正压的脉冲,使得收集区衬底中产生用于光电子收集的耗尽层,并通过右侧读出区读出收集的光电子数量,作为光输入端的输入量。读出时,在控制栅极上施加一正电压,使N型源端和收集区N型漏端间形成导电沟道,再通过在N型源端和N型漏端间施加一个偏置脉冲电压,使得导电沟道内的电子加速形成源漏之间的电流。源漏之间沟道内形成电流的载流子,受到控制栅电压、源漏间电压和收集区收集的光电子数量共同作用,作为被光输入量和电输入量共同作用后的电子,以电流的形式进行输出,其中控制栅电压、源漏间电压可以作为器件的电输入量,光电子数量则为器件的光输入量。耦合区的电荷耦合层用于连接收集区和读出区,使收集区衬底本文档来自技高网...

【技术保护点】
1.一种基于光电计算阵列的矩阵向量乘法器的运算优化方法,其特征在于,光电计算阵列由多个光电计算单元周期性排列组成,每个光电计算单元包括发光单元和计算单元,发光单元发出的光入射到计算单元中;每个计算单元包括载流子控制区、耦合区、以及光生载流子收集区和读出区;所述运算优化方法的具体步骤如下:(1)将光电计算单元排列成m行和n+1列的阵列,其中,m为待乘矩阵的行数,n为待乘矩阵的列数;阵列中,每一列计算单元的光生载流子收集区和读出区中的读出区依次相连,每一行计算单元的载流子控制区依次相连;(2)采用零点列法对所述待乘矩阵进行修正:对于所述待乘矩阵中的负数矩阵,首先给矩阵中的每一个数都加上一个零点值,使得矩阵中不再含有负数;然后在矩阵中再添加一列为第一列,并且此列的每一个值均为零点值,得到修正后的矩阵,其中零点值为某一固定位宽下的数据下限的绝对值;(3)所述发光单元发出被设置为修正后的矩阵中数据的光信号,并入射到对应的计算单元的光生载流子收集区和读出区,为矩阵向量乘法器的矩阵数据输入端;每一行计算单元的载流子控制区输入被设置为代表向量中各个元素的载流子,为矩阵向量乘法器的向量数据输入端;其中,所述向量中各个元素的数据被转化为二进制后,按照比特位串行地将代表二值化后数据的载流子输入到各个行的载流子控制区中;(4)计算单元的光生载流子收集区和读出区中的读出区输出端输出受矩阵数据和向量数据共同作用后的载流子,并在固定电压的驱动下以电流的形式输出,电流信号按列汇聚后经过AD转换,按输入的比特位进行移位操作然后累加,得到中间结果向量;(5)对于得到的中间结果向量,用数字减法器将从第二列开始的每一列结果均减去第一列的结果,即得到最终结果向量。...

【技术特征摘要】
1.一种基于光电计算阵列的矩阵向量乘法器的运算优化方法,其特征在于,光电计算阵列由多个光电计算单元周期性排列组成,每个光电计算单元包括发光单元和计算单元,发光单元发出的光入射到计算单元中;每个计算单元包括载流子控制区、耦合区、以及光生载流子收集区和读出区;所述运算优化方法的具体步骤如下:(1)将光电计算单元排列成m行和n+1列的阵列,其中,m为待乘矩阵的行数,n为待乘矩阵的列数;阵列中,每一列计算单元的光生载流子收集区和读出区中的读出区依次相连,每一行计算单元的载流子控制区依次相连;(2)采用零点列法对所述待乘矩阵进行修正:对于所述待乘矩阵中的负数矩阵,首先给矩阵中的每一个数都加上一个零点值,使得矩阵中不再含有负数;然后在矩阵中再添加一列为第一列,并且此列的每一个值均为零点值,得到修正后的矩阵,其中零点值为某一固定位宽下的数据下限的绝对值;(3)所述发光单元发出被设置为修正后的矩阵中数据的光信号,并入射到对应的计算单元的光生载流子收集区和读出区,为矩阵向量乘法器的矩阵数据输入端;每一行计算单元的载流子控制区输入被设置为代表向量中各个元素的载流子,为矩阵向量乘法器的向量数据输...

【专利技术属性】
技术研发人员:王瑶陈轩王宇宣
申请(专利权)人:南京惟心光电系统有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1