Systems, methods and devices for configurable space accelerators are described. In one embodiment, the processor comprises a core, the core having a decoder and an execution unit, which decodes the instruction as a decoded instruction, the executive unit is used to execute the decoded instruction to perform the first operation, a plurality of processing elements, and an interconnection network, between the plurality of the processing elements. The interconnection network is used to receive input of a data flow graph including a plurality of nodes, in which the data flow graph is used to be covered in the interconnected network and the plurality of processing elements, and each node is represented as a data flow operator in the plurality of processing elements, and the plurality of processing elements is used when the data stream is used. The second operation is performed when the set of incoming operands reaches the plurality of processing elements.
【技术实现步骤摘要】
具有可配置空间加速器的处理器、方法和系统关于联邦资助的研发的声明本专利技术是在由国防部授予的合同号H98230A-13-D-0124的政府支持下进行的。政府具有本专利技术的某些权利。
本公开总体上关于电子学,更具体地,本公开的实施例关于可配置空间加速器。
技术介绍
处理器或处理器集合执行来自指令集(例如,指令集架构(ISA))的指令。指令集是涉及编程的计算机架构的一部分,并且一般包括原生数据类型、指令、寄存器架构、寻址模式、存储器架构、中断和异常处理以及外部输入和输出(I/O)。应当注意,术语“指令”在本文中一般是指宏指令(例如,提供给处理器供执行的指令),或者指微指令(例如,由处理器的解码器解码宏指令所产生的指令)。附图说明在所附附图中以示例方式而非限制方式说明本公开,在附图中,类似的参考标号指示类似的元件,其中:图1示出根据本公开的实施例的加速器片。图2示出根据本公开的实施例的耦合至存储器的硬件处理器。图3A示出根据本公开的实施例的程序源。图3B示出根据本公开的实施例的针对图3A的程序源的数据流图。图3C示出根据本公开的实施例的加速器,该加速器具有配置成用于执行图3B的数据流图的多个处理元件。图4示出根据本公开的实施例的数据流图的示例执行。图5示出根据本公开的实施例的程序源。图6示出根据本公开的实施例的加速器片,该加速器片包括处理元件的阵列。图7A示出根据本公开的实施例的可配置数据路径网络。图7B示出根据本公开的实施例的可配置流控制路径网络。图8示出根据本公开的实施例的包括加速器的硬件处理器片。图9示出根据本公开的实施例的处理元件。图10示出根据本公开 ...
【技术保护点】
1.一种处理器,包括:核,所述核具有解码器和执行单元,所述解码器用于将指令解码为经解码指令,所述执行单元用于执行所述经解码指令以执行第一操作;多个处理元件;以及互连网络,在所述多个处理元件之间,所述互连网络用于接收包括多个节点的数据流图的输入,其中,所述数据流图用于被覆盖到所述互连网络和所述多个处理元件中,并且每一个节点被表示为所述多个处理元件中的数据流操作器,并且所述多个处理元件用于当传入操作数集到达所述多个处理元件时执行第二操作。
【技术特征摘要】
2016.12.30 US 15/396,4021.一种处理器,包括:核,所述核具有解码器和执行单元,所述解码器用于将指令解码为经解码指令,所述执行单元用于执行所述经解码指令以执行第一操作;多个处理元件;以及互连网络,在所述多个处理元件之间,所述互连网络用于接收包括多个节点的数据流图的输入,其中,所述数据流图用于被覆盖到所述互连网络和所述多个处理元件中,并且每一个节点被表示为所述多个处理元件中的数据流操作器,并且所述多个处理元件用于当传入操作数集到达所述多个处理元件时执行第二操作。2.如权利要求1所述的处理器,进一步包括多个配置控制器,每一个配置控制器耦合到所述多个处理元件的相应子集,并且每一个配置控制器用于从存储加载配置信息并且引起所述多个处理元件的相应子集根据所述配置信息耦合。3.如权利要求2所述的处理器,进一步包括多个配置高速缓存,每一个配置控制器耦合至相应的配置高速缓存以取出用于所述多个处理元件的相应子集的配置信息。4.如权利要求3所述的处理器,其中,由所述执行单元执行的所述第一操作用于将配置信息预取到所述多个配置高速缓存中的每一个中。5.如权利要求2所述的处理器,其中,所述多个配置控制器中的每一个包括重配置电路,所述重配置电路用于:在从所述多个处理元件的相应子集中的至少一个处理元件接收到配置错误消息时引起对所述至少一个处理元件的重配置。6.如权利要求2所述的处理器,其中,所述多个配置控制器中的每一个包括重配置电路,所述重配置电路用于:在接收到重配置请求消息时引起对所述多个处理元件的相应子集的重配置;以及禁用与所述多个处理元件的相应子集的通信,直到所述重配置完成。7.如权利要求1所述的处理器,进一步包括多个异常聚合器,并且每一个异常聚合器耦合至所述多个处理元件的相应子集,从便所述多个处理元件的相应子集收集异常并将所述异常转发至所述核以用于维护。8.如权利要求1-7中的任一项所述的处理器,进一步包括多个提取控制器,每一个提取控制器耦合至所述多个处理元件的相应子集,并且每一个提取控制器用于使来自所述多个处理元件的相应子集的状态数据被保存到存储器。9...
【专利技术属性】
技术研发人员:K·弗莱明,K·D·格洛索普,小西蒙·C·史迪力,J·唐,A·G·加拉,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。