【技术实现步骤摘要】
【国外来华专利技术】自愈计算阵列相关申请本专利申请享有于2017年12月20日提交的标题为“自愈计算阵列”的美国临时申请(申请号:15/849,468)以及2016年12月21日提交的标题为“自愈计算阵列架构”的美国临时专利申请(申请号:62/437,554)的优先权和权益,其全文以引用方式并入本文件。
本公开涉及用于诸如人工智能(AI)、机器学习(ML)、数字信号处理(DSP)、图形处理单元(GPU)和其他计算密集型应用的硬件计算阵列(有时称为脉动阵列)。具体而言,本公开涉及高效且廉价地实施此类阵列的新颖且有利的架构创新。专利技术技术近年来,异构计算广泛用于越来越多的应用领域。值得注意的是,在诸如视频显示器和游戏、数字信号处理(DSP)、图像处理、机器学习、大数据、高性能计算、网络分组处理、数据加密等领域的主流计算设备中使用图形处理单元(GPU)和其他专用协处理器。此类协处理器通常用于支持充当系统的主处理器的中央处理单元(CPU)或微处理单元(MPU)的同构集群。许多异构协处理器使用计算阵列来实现,计算阵列是包括同构数据处理单元(DPU)的行和列的并行计算架构。其优点是能够在DPU之间传递部分结果的重复计算,并且在阵列内完全执行该重复计算而无需访问外部资源,诸如高速缓存、主存储器、总线等。这避免了更常规的复杂指令集计算(CISC)或减小的指令集计算(RISC)计算架构中存在的许多瓶颈。图1示出了本领域已知类型的示例性简化的DPU100。DPU100包括多个值输入102、输入复用器104、值存储器106、系数存储器108、乘积和累加电路110以及值输出112。DPU100 ...
【技术保护点】
1.一种包括数据处理单元的行和列的计算阵列,每个数据处理单元包括:多个数据输入导体,每个输入数据导体包括一条或多条导电信号线的总线;输入处理电路,所述输入处理电路耦合到所述多个数据输入导体;数据存储器,所述数据存储器耦合到所述输入处理电路;计算引擎,所述计算引擎耦合到所述数据存储器;数据输出导体,所述数据输出导体耦合到所述计算引擎,所述数据输出导体包括一条或多条导电信号线的总线;和控制和测试电路,所述控制和测试电路耦合到所述输入处理电路、所述数据存储器和所述计算引擎,其中每个数据输入导体耦合到另一数据处理单元的所述数据输出导体,并且每个数据输出导体耦合到另一数据处理单元的所述数据输入导体。
【技术特征摘要】
【国外来华专利技术】2016.12.21 US 62/437,5541.一种包括数据处理单元的行和列的计算阵列,每个数据处理单元包括:多个数据输入导体,每个输入数据导体包括一条或多条导电信号线的总线;输入处理电路,所述输入处理电路耦合到所述多个数据输入导体;数据存储器,所述数据存储器耦合到所述输入处理电路;计算引擎,所述计算引擎耦合到所述数据存储器;数据输出导体,所述数据输出导体耦合到所述计算引擎,所述数据输出导体包括一条或多条导电信号线的总线;和控制和测试电路,所述控制和测试电路耦合到所述输入处理电路、所述数据存储器和所述计算引擎,其中每个数据输入导体耦合到另一数据处理单元的所述数据输出导体,并且每个数据输出导体耦合到另一数据处理单元的所述数据输入导体。2.根据权利要求1所述的计算阵列,其中:每个数据处理单元被划分为大致包括数据储存器的存储块以及大致包括数据处理单元的剩余部分的计算块,相同数据处理单元中的每个存储块以及其相关联的计算块来自两个不同的集成电路,并且相同数据处理单元中的每个存储块和计算块通过以下至少一种互连技术耦合在一起:面对面键合、晶片到晶片键合、通过连接硅、介电键合技术、氧化物与氧化物直接键合以及混合键合。3.根据权利要求2所述的计算阵列,其中每个控制和测试电路被配置为:测试其数据处理单元的功能,以及测试耦合到其数据处理单元的其它数据处理单元之间的数据输入导体连接和数据输出导体互连。4.根据权利要求3所述的计算阵列,其中每个控制和测试电路被配置为对其数据处理单元中的计算引擎的计算功能进行编程。5.根据权利要求1所述的计算阵列,每个数据处理单元还包括:多个数据共享导体,所述多个数据共享导体耦合到多个其他数据处理单元的数据共享导体,每个数据共享导体包括一条或多条导电信号线的总线;和数据共享电路,所述数据共享电路耦合到所述数据共享导体、所述数据存储器、所述计算引擎以及所述控制和测试电路,并被配置为:选择性地将所述数据存储器耦合到所述多个数据共享导体,以及选择性地将所述计算引擎耦合到所述数据共享导体。6.根据权利要求5所述的计算阵列,其中:每个数据处理单元被划分为大致包括所述数据储存器的存储块以及大致包括所述数据处理单元的剩余部分的计算块,相同数据处理单元中的每个存储块以及其相关联的计算块来自两个不同的集成电路,并且相同数据处理单元中的每个存储块以及其相关联的计算块通过以下至少一种互连技术耦合在一起:面对面键合、晶片到晶片键合、通过连接硅、介电键合技术、氧化物与氧化物直接键合以及混合键合。7.根据权利要求6所述的计算阵列,其中每个控制和测试电路被配置为:测试与其相关联的数据处理单元的功能,测试耦合到其数据处理单元的其它数据处理单元之间的数据输入导体连接和数据输出导体互连,以及测试耦合到其数据处理单元的其他数据处理单元之间的数据共享互连。8.根据权利要求7所述的计算阵列,其中每个控制和测试电路被配置为对其数据处理单元中的计算引擎的计算功能进行编程。9.根据权利要求6所述的计算阵列,其中每个数据共享电路可被配置为允许相同数据处理单元中的所述计算引擎访问不同数据处理单元的所述数据存储器。10.根据权利要求9所述的计算阵列,其中允许相同数据处理单元中的所述计算引擎作为所述数据共享电路访问不...
【专利技术属性】
技术研发人员:J·A·德拉克鲁斯,S·L·泰格,D·E·菲施,W·C·普兰斯,
申请(专利权)人:艾克瑟尔西斯公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。