滕斯托伦特股份有限公司专利技术

滕斯托伦特股份有限公司共有19项专利

  • 本文公开了与计算硬件相关的方法和系统。一种公开的使用计算硬件块执行乘法计算的方法包括存储用于乘法计算的第一操作数和第二操作数。第一操作数包括第一组位串。第二操作数包括第二组位串。该方法还包括使用计算硬件块在一组时间阶段中将第一组位串和第...
  • 本公开提供了多核处理器堆栈以及多核处理器。所述多核处理器堆栈存储在多核处理器中的非暂态计算机可读介质上,包括:计算层,用于使用所述多核处理器中的处理核心集合来进行计算,具有用于所述处理核心集合中的处理管线集合的可执行指令;片上网络层,用...
  • 本发明公开了与减少执行人工神经网络(ANN)所需的计算量相关的方法和系统。所公开的方法包括:生成数据集的概要,该概要是复合计算的输入;使用概要执行简化复合计算,以产生简化的输出;以及使用简化输出执行第二简化复合计算,以产生作为预测结果的...
  • 本文公开了与减少执行人工神经网络(ANN)所需的计算次数相关的方法和系统。该方法包括在ANN执行期间进行的计算机实现的方法。该方法包括生成一组执行数据,生成ANN的一组神经网络数据的概要,生成ANN执行的一组执行数据的概要,使用该组神经...
  • 本文公开了与计算电路有关的方法和系统。一种公开的计算电路包括数学电路、第一累加器和第二累加器。所述第一累加器具有第一存储器。所述第二累加器具有第二存储器。所述第一累加器可通信地连接到所述数学电路,并在所述第一存储器中累加来自所述数学电路...
  • 本文公开了涉及并行计算领域的方法和系统。所公开的方法和系统包括用于对用于执行复杂计算的计算节点组实施稀疏均匀性的方法。所公开的方法包括确定操作数数据组中的稀疏分布,以及使用编译器生成用于使用操作数数据组和处理核组来执行复杂计算的指令组。...
  • 本文公开了与具有预先暂存指令的改进处理架构相关的方法和系统。所公开的处理器包括指令存储器,至少一个功能处理单元,总线,一组指令寄存器以及逻辑电路,一组指令寄存器配置为使用总线加载来自指令存储器的一组预先暂存指令,逻辑电路配置为响应于从指...
  • 本发明公开了用于加速执行有向图的方法和系统。所述执行可以涉及从提供给人工神经网络的一组输入中生成推理。在具体的示例中,用于执行有向图的方法包括接收至少两批索引。当批量索引用于访问一组嵌入时,提供至少两批嵌入输出,并执行所述有向图的一层。...
  • 本发明公开了与缓存有关的方法和系统。一种公开的系统包括至少一个存储至少两个数据结构的存储器。所述至少两个数据结构包括第一数据结构和第二数据结构。所述系统还包括至少两个缓存,第一缓存用于缓存所述第一数据结构,第二缓存用于缓存所述第二数据结...
  • 公开了用于使用计算节点的网络来执行应用数据流图的方法和系统。在特定示例中,计算节点的网络可以是多核处理器的片上网络。一种方法包括将第一应用数据从第一源计算节点过渡到中间计算节点。该方法还可以包括在中间计算节点上从计算节点的网络的计算层提...
  • 本文公开了具有数据关联自适应舍入的处理核心和关联方法。一个公开的处理核心包括:配置为使用输入的定向图数据生成定向图数据的单元的值的算术逻辑单元集群,耦合至阈值寄存器和数据寄存器的比较器,配置为当定向图数据的单元的值被加载到数据寄存器中时...
  • 本文公开了与互连结构上路由的推测性资源分配相关的方法和系统。一种公开的方法包括推测性地分配资源集合以支持通过互连结构的一组路径。该方法还包括在该组路径上的分支节点处聚集来自该组路径的一组响应。如果检测到资源争用,则该组响应将包括资源争用...
  • 公开了与由多核处理器高效执行复杂计算以及在多核处理器中的各个处理核心之间的数据移动相关的方法和系统。用于多核处理器的多核处理器堆栈能够包括计算层,用于使用多核处理器中的处理核心来进行计算,具有用于该处理核心中的处理管线的可执行指令。多核...
  • 公开了关于稀疏数据的快速且高效的压缩和解压缩的方法和系统。一种用于压缩来自稀疏矩阵的数据集的方法包括:评估来自该数据集的数据条目的序列;从该序列提取稀疏数据值的序列;从该序列提取非稀疏数据值行程长度的序列;根据该序列制定行指针的集合;将...
  • 公开了使用分组标识符进行路由和计算的处理器核。一种方法包括使用一组处理核执行复杂计算。该方法包括使用一组分组标识符来路由一组分组,并执行一组指令。该组指令是使用一组操作数标识符定义的。操作数标识符表示该组分组标识符中的分组标识符。在特定...
  • 本文公开了具有数据关联自适应舍入的处理核心和关联方法。一个公开的处理核心包括:配置为使用输入的定向图数据生成定向图数据的单元的值的算术逻辑单元集群,耦合至阈值寄存器和数据寄存器的比较器,配置为当定向图数据的单元的值被加载到数据寄存器中时...
  • 公开了一种用于有向图的高效执行的处理核心。处理核心包括存储器以及储存在存储器中的第一数据片和第二数据片。第一数据片和第二数据片包括连续储存在存储器中的数据元素的第一集合和数据元素的第二集合。处理核心还包括与第一数据片相关地储存在存储器中...
  • 公开了具有基于对操作的贡献估计来抑制那些操作的能力以提高核心的整体性能的处理核心。还公开了可以由这样的处理核心实施的相关方法。一种这样的方法包括生成用于复合计算的参考值。复合计算的完整执行生成精确的输出并且需要执行分量计算集合。该方法还...
  • 本文公开了用于执行有向图的计算机实施的方法和相关联的硬件。一种示例方法包括导出有向图的简化版本、将先导输入张量应用于有向图的简化版本,以及在将先导输入张量应用于有向图的简化版本期间获得执行数据的集合。该方法还包括将实时输入张量应用于有向...
1