基于印录存储阵列的可编程计算阵列封装制造技术

技术编号:22137581 阅读:62 留言:0更新日期:2019-09-18 11:00
本发明专利技术提出一种新型可编程门阵列——可编程计算阵列封装。它含有至少一可编程计算芯片和一可编程逻辑芯片。可编程计算芯片含有多个可编程计算单元,每个可编程计算单元含有多个印录存储阵列,每个印录存储阵列存储一基本函数库的查找表(LUT)。可编程计算芯片和可编程逻辑芯片垂直堆叠,并通过芯片间连接电耦合。

Programmable Computing Array Packaging Based on Print Memory Array

【技术实现步骤摘要】
基于印录存储阵列的可编程计算阵列封装
本专利技术涉及集成电路领域,更确切地说,涉及可编程门阵列。
技术介绍
可编程门阵列属于半定制集成电路,即通过后端工艺或现场编程,实现对逻辑电路的定制化。美国专利4,870,302披露了一种可编程门阵列。它含有多个可编程逻辑单元(configurablelogicelement,或configurablelogicblock)和可编程连接(configurableinterconnect,或programmableinterconnect)。其中,可编程逻辑单元在设置信号控制下可以选择性地实现移位、逻辑非、AND(逻辑与)、OR(逻辑和)、NOR(和非)、NAND(与非)、XOR(异或)、+(算术加)、-(算术减)等功能;可编程连接在设置信号控制下可以选择性地实现两条互连线之间的连接、断开等功能。目前,很多应用均涉及复杂数学函数的计算。复杂数学函数的例子包括超越函数,如指数(exp)、对数(log)、三角函数(sina、cos)以及它们的组合等。为了保证执行速度,高性能应用要求用硬件来实现复杂数学函数。在现有的可编程门阵列中,复杂数学函数均通过来固化计算单元来实现。这些固化计算单元为硬核(hardblock)的一部分,其电路已经固化、不能对其进行再配置。很明显,固化计算单元将限制可编程门阵列的进一步应用。为了克服这个困难,本专利技术将可编程门电路的概念推广,使固化计算单元可编程化。具体说来,可编程门电路除了含有可编程逻辑单元以外,还含有可编程计算单元。该可编程计算单元可以选择性地实现多种基本函数中的一种。
技术实现思路
本专利技术的主要目的是推广可编程门电路在复杂数学计算领域的应用。本专利技术的另一目的是提供一种可编程计算电路,不仅其逻辑功能可以被定制,其计算功能也可以被定制。本专利技术的另一目的是提供一种计算能力更灵活、更强大的可编程门阵列。为了实现这些以及别的目的,本专利技术提出一种新型可编程门阵列——可编程计算阵列封装。它含有至少一可编程计算芯片和一可编程逻辑芯片。可编程计算芯片含有多个可编程计算单元,每个可编程计算单元含有多个印录存储阵列,每个印录存储阵列存储一基本函数库的查找表(LUT)。可编程计算芯片和可编程逻辑芯片垂直堆叠,并通过芯片间连接电耦合。对于高性能可编程计算单元来说,三维印录存储器(three-dimensionalprintedmemory,简称为3D-P,参见中国专利201280042212.5)尤其适合存储LUT。3D-P是三维存储器(three-dimensionalmemory,简称为3D-M,参见中国专利98119572.5)的一种,其存储的信息是在工厂生产过程中采用采用印刷方式录入的(印录法,如光刻、纳米压印等手段)录入的。这些信息永久固定,出厂后不能改变。由于3D-P存储元不需要实现电编程,它可以比三维可写存储器(three-dimensionalwritablememory,简称为3D-W)承受更大的读电压和读电流。因此,3D-P的读速度远快于3D-W。除了可编程计算单元,可编程计算阵列封装还含有多个可编程逻辑单元和可编程连接。复杂数学函数是基本函数(包括log、exp、sin、cos、sqrt、cbrt、tan、atan等)的一种组合。在其实现过程中,复杂数学函数首先被分解为多个基本函数。然后针对每个基本函数设置对应的可编程计算单元,使其实现相应的基本函数。最后,通过设置可编程逻辑单元和可编程连接,实现所需的复杂数学函数。采用3D-P来实现可编程计算单元有诸多优势:首先,3D-P比3D-W的读速度快,可实现高性能计算单元;其次,不同基本函数所需的3D-P阵列大小均相同或相差整数倍。代表不同基本函数的3D-P阵列可放置在不同存储层中,并通过三维堆叠集成到同一3D-M模块中。这能极大地减少可编程计算单元所占的衬底面积。最后,由于3D-P阵列基本不占衬底面积,计算单元内可编程连接可以集成在3D-P阵列下方,这样可以进一步减少可编程计算单元所占的衬底面积。相应地,本专利技术提出一种可编程计算阵列封裝(400),其特征在于含有:一含有多个可编程计算单元(100,100AA-100AD)的可编程计算芯片(100W),该可编程计算单元(100)含有:第一和第二三维印录存储器(3D-P)阵列(110,120),该第一3D-P阵列(110)存储一第一基本函数的至少部分查找表(LUTA),该第二3D-P阵列(120)存储一第二基本函数的至少部分查找表(LUTB);至少一与该第一和第二3D-P阵列耦合的计算单元内可编程连接(150或160),基于该计算单元内可编程连接的设置信号(125),该可编程计算单元(100)选择性地实现该第一或第二基本函数;一含有多个可编程逻辑单元(200,200AA-200AD)的可编程逻辑芯片(200W),该可编程逻辑单元(200)从一逻辑运算库中选择性地实现一种逻辑运算;所述可编程计算芯片(100W)和所述可编程逻辑芯片(200W)分别形成在不同衬底上,并通过多个芯片间连接(180)电耦合。附图说明图1是一种可编程计算单元的符号。图2是一种可编程计算单元的电路框图,该图同时披露了该可编程计算单元实现的基本函数库。图3是该可编程计算单元的第一种实现方式,该图为其电路图。图4A-图4B是该可编程计算单元的第二种实现方式,图4A为其截面图;图4B为其衬底电路布局图。图5是一种可编程计算阵列封装的电路图。图6A披露一种可编程连接实现的连接库;图6B披露一种可编程逻辑单元实现的逻辑运算库。图7是一种可编程计算阵列封装具体实现的电路图。图8是一种可编程计算阵列封装的透视图。图9A-9C是三种可编程计算阵列封装的截面图。注意到,这些附图仅是概要图,它们不按比例绘图。为了显眼和方便起见,图中的部分尺寸和结构可能做了放大或缩小。在不同实施例中,相同的符号一般表示对应或类似的结构。具体实施方式图1是一种可编程计算单元100的符号。其输入端IN包括输入数据115,输出端OUT包括输出数据135,设置端CFG包括设置信号125。在设置信号125的控制下,该可编程计算单元100从一基本函数库中选择所需的基本函数。图2是一种可编程计算单元100的电路框图,该图同时披露了该可编程计算单元100能实现的基本函数库。它含有第一和第二计算单元内可编程连接150、160、以及存储一基本函数库的LUTA-D。在本实施例中,第一计算单元内可编程连接150是一1到4的demux,第二计算单元内可编程连接160是一4到1的mux,该基本函数库包括对数log()、指数exp()、对数正弦log[sin()]和对数余弦log[cos()]。LUTA存储对数表log()、LUTB存储指数表exp()、LUTC存储对数正弦表log[sin()]、LUTD存储对数余弦表log[cos()]。比如说,为了实现函数exp(),第一计算单元内可编程连接150将输入数据115送到相应的LUTB作为地址。基于这个地址进行查表,即读出LUTB中的值(exp())。然后第二计算单元内可编程连接160将从该值送到输出作为输出数据135。对于熟悉本领域的专业人士来说,基本函数库可以含有更多的基本函数。比较本文档来自技高网...

【技术保护点】
1.一种可编程计算阵列封裝(400),其特征在于含有:一含有多个可编程计算单元(100, 100AA‑100AD)的可编程计算芯片(100W),该可编程计算单元(100)含有:第一和第二三维印录存储器(3D‑P)阵列(110, 120),该第一3D‑P阵列(110)存储一第一基本函数的至少部分查找表(LUT A),该第二3D‑P阵列(120)存储一第二基本函数的至少部分查找表(LUT B);至少一与该第一和第二3D‑P阵列耦合的计算单元内可编程连接(150或160),基于该计算单元内可编程连接的设置信号(125),该可编程计算单元(100)选择性地实现该第一或第二基本函数;一含有多个可编程逻辑单元(200, 200AA‑200AD)的可编程逻辑芯片(200W),该可编程逻辑单元(200)从一逻辑运算库中选择性地实现一种逻辑运算;所述可编程计算芯片(100W)和所述可编程逻辑芯片(200W)分别形成在不同衬底上,并通过多个芯片间连接(180)电耦合。

【技术特征摘要】
1.一种可编程计算阵列封裝(400),其特征在于含有:一含有多个可编程计算单元(100,100AA-100AD)的可编程计算芯片(100W),该可编程计算单元(100)含有:第一和第二三维印录存储器(3D-P)阵列(110,120),该第一3D-P阵列(110)存储一第一基本函数的至少部分查找表(LUTA),该第二3D-P阵列(120)存储一第二基本函数的至少部分查找表(LUTB);至少一与该第一和第二3D-P阵列耦合的计算单元内可编程连接(150或160),基于该计算单元内可编程连接的设置信号(125),该可编程计算单元(100)选择性地实现该第一或第二基本函数;一含有多个可编程逻辑单元(200,200AA-200AD)的可编程逻辑芯片(200W),该可编程逻辑单元(200)从一逻辑运算库中选择性地实现一种逻辑运算;所述可编程计算芯片(100W)和所述可编程逻辑芯片(200W)分别形成在不同衬底上,并通过多个芯片间连接(180)电耦合。2.根据权利要求1所述的可编程计算阵列封装(400),其特征还在于含有:多个将该可编程计算单元(100AA-100AD)和该可编程逻辑单元(200AA-200AD)选择性耦合的可编程连接(300)。3.根据权利要求1所述的可编程计算阵列封装(400),其特征还在于:通过对该可编程计算单元(100AA-100...

【专利技术属性】
技术研发人员:张国飙
申请(专利权)人:杭州海存信息技术有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1