计算单元、阵列及计算方法技术

技术编号:38333081 阅读:15 留言:0更新日期:2023-08-02 09:13
本发明专利技术公开了一种计算单元,使用这一计算单元进行高并行计算的计算单元阵列及计算方法,主要解决现有技术受器件电流

【技术实现步骤摘要】
计算单元、阵列及计算方法


[0001]本专利技术属于集成电路领域,更具体地,涉及集成电路计算芯片的体系架构和工作方式。

技术介绍

[0002]随着物联网与云计算的发展,计算任务的复杂性与日俱增,给计算芯片带来更大的压力。其中,计算芯片的主要性能指标可以分为功耗和算力指标。无论是在物联网等供能受限的场景还是云计算等消耗大量能量的场景中,功耗指标都是十分关键的。因此,如何在提供给定算力的前提下,进一步降低芯片功耗,是计算芯片的重要研究方向。
[0003]计算芯片的功耗主要来自两部分操作,一是数据读写,二是数据计算。对于特定计算,如深度神经网络中涉及的推理和训练计算,会出现大量的数据读写操作。数据读写的目标存储器可以分为片上存储和片外存储。由于片上存储广泛采用静态随机存储器(SRAM),其密度较低,因此其存储容量往往较小。当遇到大量数据读写操作时,就需要对片外存储进行访问。考察数据读写操作,对互连线周围寄生电容的充放电是其主要能耗来源。而片外存储通过较大间距的互连线和引脚进行数据访问,会产生相比片上存储大得多的能耗。针对这一现象,将数据尽可能地部署在片上存储中,并进一步降低对片上存储的数据访问是优化计算芯片能效的重要策略。
[0004]存算一体化架构就是其中的一个具体实现。这一架构通过构造基于忆阻器的高密度计算单元,可以将计算数据部分固化在计算单元内,从而减少了对于数据的访问操作。同时,由于采用模拟计算的方式,它对于存储数据有一定的鲁棒性,因而可以实现更大规模的片上存储。一种典型的存内计算方式是,在电导值为矩阵G的忆阻器阵列一侧通过数字

模拟转换器(DAC)输入电压向量V,通过测量正交的另一侧的输出电流向量I,即可以实现I=GV的矩阵

向量乘法计算。其中,在神经网络推理的计算场景中,G对应网络权重,更新较少,V对应数据的特征图,更新较多。
[0005]上述典型计算方式对于忆阻器器件提出了一个基本要求,也就是需要表现出高度线性的电流

电压关系。现有的存储器技术均只存在一个小范围的线性区,因此要满足这一要求需要将输入电压的范围限制在一个很小的范围,这反过来对输入电路提出了较大的挑战。其次,在全并行的情况下,阵列横向的互连线都输入信号,从而需要进行互连线的寄生电容充电到输入电压。这一过程将会消耗大量的能量。

技术实现思路

[0006]本专利技术的目的在于解决上述技术问题,提出一种计算单元、阵列及计算方法。
[0007]本专利技术的目的是通过以下技术方案实现的:
[0008]第一方面,提供一种计算单元,包括:
[0009]一个树状的网络,所述网络包含一个父节点和至少两个子节点,所述父节点和至少一个子节点间具有导通能力;
[0010]至少一个前向的电流驱动级,与所述网络的父节点相连;
[0011]多个后端的电流采样级,与所述网络的子节点一一对应相连。
[0012]进一步地,所述电流驱动级包括串联的电压数模转换器和限流电阻。
[0013]进一步地,所述网络的导通能力能够调节,可采用但不限于以下方式:
[0014]方式一:所述计算单元包括一种存储结构,具有至少两个满足如下条件的端口,记为端口一和端口二,即在存储不同数据时,通过对所述端口一和端口二给定不同的固定输入,两个端口间电流存在差异;
[0015]所述子节点均和至少一个所述存储结构的端口一或端口二相连,所述存储结构未连接到所述子节点的端口一或端口二和所述父节点相连;通过对所述存储结构进行数据写入实现所述网络的导通能力调节;
[0016]该方式下,存储结构可以采用忆阻器,通过对忆阻器进行状态调节实现所述网络的导通能力调节。
[0017]方式二:所述父节点和子节点间包括磁阻存储器、阻变存储器、相变存储器、铁电存储器、静态随机存储器、动态随机存储器、浮栅存储器以及电荷捕获存储器中的一种或多种,用于实现所述网络的导通能力调节。
[0018]第二方面,提供一种如第一方面所述的计算单元的计算方法,包括:
[0019]步骤一,将所述电流采样级输入端电位设置为与所述电流驱动级的零电位相同;
[0020]步骤二,在所述电流驱动级施加电流;
[0021]步骤三,在所述电流采样级进行电流采样;
[0022]其中先后顺序满足,步骤二先于步骤三,步骤一先于步骤三。
[0023]第三方面,提供一种实现并行计算的计算单元阵列,可采用但不限于以下方式:
[0024]方式一:包括多个如第一方面所述的计算单元;
[0025]一个后端电流采样级至少连接两个不同计算单元内的子节点。
[0026]方式二:包括多个如第一方面所述的计算单元;
[0027]一个前向电流驱动级至少连接两个不同计算单元内的父节点。
[0028]方式三:包括多个如第一方面所述的计算单元;
[0029]一个后端电流采样级至少连接两个不同计算单元内的子节点;
[0030]一个前向电流驱动级至少连接两个不同计算单元内的父节点。
[0031]第四方面,提供一种如第三方面所述的计算单元阵列的计算方法,包括:
[0032]步骤一,将所述电流采样级输入端电位设置为与所述电流驱动级的零电位相同;
[0033]步骤二,在所述电流驱动级施加电流;
[0034]步骤三,在所述电流采样级进行电流采样;
[0035]其中先后顺序满足,步骤二先于步骤三,步骤一先于步骤三。
[0036]本专利技术的有益效果是:本专利技术提出了一种新的计算原理,基于该原理,可以通过使用合适范围的电流输入,使得器件工作在低压状态,且阵列计算时电流方便可控,从而解决忆阻器器件电流

电压关系中的非线性问题和进行阵列规模的并行运算时功耗较高的问题。
[0037]本领域的技术人员在阅读以下具体实施方式并看到附图时将会认识到附加的特征和和优势。
附图说明
[0038]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0039]图1示出了传统存内计算的结构和计算方法;
[0040]图2示出了一种模拟计算单元及其对应的外围电路的实现方式;
[0041]图3示出了一种模拟计算单元实现计算的基本原理;
[0042]图4示出了一种电流驱动级的实现方式;
[0043]图5示出了一种模拟计算单元及其对应的外围电路的实现方式;
[0044]图6示出了一种的模拟计算单元实现计算的基本原理;
[0045]图7示出了一种包含磁隧穿结的模拟计算单元及其对应的外围电路的实现方式;
[0046]图8示出了一种基于电荷存储器的结构;
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算单元,其特征在于,包括:一个树状的网络,所述网络包含一个父节点和至少两个子节点,所述父节点和至少一个子节点间具有导通能力;至少一个前向的电流驱动级,与所述网络的父节点相连;多个后端的电流采样级,与所述网络的子节点一一对应相连。2.根据权利要求1所述的计算单元,其特征在于,所述电流驱动级包括串联的电压数模转换器和限流电阻。3.根据权利要求1所述的计算单元,其特征在于,所述网络的导通能力能够调节。4.根据权利要求3所述的计算单元,其特征在于,所述计算单元包括一种存储结构,具有至少两个满足如下条件的端口,记为端口一和端口二,即在存储不同数据时,通过对所述端口一和端口二给定不同的固定输入,两个端口间电流存在差异;所述子节点均和至少一个所述存储结构的端口一或端口二相连,所述存储结构未连接到所述子节点的端口一或端口二和所述父节点相连;通过对所述存储结构进行数据写入实现所述网络的导通能力调节。5.根据权利要求4所述的计算单元,其特征在于,所述存储结构为忆阻器,通过对忆阻器进行状态调节实现所述网络的导通能力调节。6.根据权利要求4所述的计算单元,其特征在于,所述父节点和子节点间包括磁阻存储器、阻变存储器、相变存储器、铁电存储器、静态随机存储器、动态随机存储器、浮栅存储器以及电荷捕获存储器中的一种或多种,用于实现所述网络的导通能力调节。7.一种权利要求1
‑...

【专利技术属性】
技术研发人员:赵先成
申请(专利权)人:浙江力德仪器有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1