【技术实现步骤摘要】
【国外来华专利技术】可配置的硬件的运行时间优化相关申请的交叉引用本申请主张2017年8月3号提交的美国临时申请第62/540,849号及2017年9月13号提交的美国临时申请第62/558,090号的权益,其内容通过引用并入本文中。
本公开通常有关于硬件的运行时间优化,更具体地,是有关用于可配置的硬件的运行时间优化的多个技术。
技术介绍
随着科技的进步,对具有较高的处理功率的更强大的处理系统的需求迅速地增加。如今,多个处理器被期望用以传送高计算通量,并且具有高功率效率。然而,现存的多个处理系统执行多个连续的指令流,所述多个连续的指令流通过外显存储进行通信,而因此受到模型功率无效率的困扰。在多个现代的处理架构中,每个动态指令必须被提取及解码,即便多个程序大部分在所述代码的多个较小的静态部分上进行迭代。再者,由于外显状态的存储器为用于在多个指令之间传递数据的唯一通道,因此多个中间结果在多个功能单元与多个寄存器文件之间被重复地传输。多个现代的计算架构的多个限制包括高功率消耗、散热、网络及多个I/O瓶颈,以及存储器分区。例如,一现场可编程门阵列(FPGA)在配置有软件的硬件电路上运作。所述FPGA允许具有低延迟时间的很高的通量率。所述FPGA的可配置性可被使用作为在多核心架构中的协同处理器,或者可被放置于多个关键数据路径中,以卸载对于一系统的CPU所进行的处理。FPGA的多个主要的缺点的其中一个为缺乏灵活的可编程性。进一步地,一FPGA的所述计算功率相对地低。一可编程的处理架构的一示例为一多核心处理器。一 ...
【技术保护点】
1.一种用于一可配置的处理架构的运行时间优化的方法,其特征在于:所述方法包含︰/n接收用于运行至少一函数的多个调用;/n辨识在所述多个调用之间的至少一模式;及/n基于所述至少一模式,操作所述可配置的处理架构的至少一部分来计算所述至少一函数。/n
【技术特征摘要】
【国外来华专利技术】20170803 US 62/540,849;20170913 US 62/558,0901.一种用于一可配置的处理架构的运行时间优化的方法,其特征在于:所述方法包含︰
接收用于运行至少一函数的多个调用;
辨识在所述多个调用之间的至少一模式;及
基于所述至少一模式,操作所述可配置的处理架构的至少一部分来计算所述至少一函数。
2.如权利要求1所述的方法,其特征在于:每个所述调用被引导至一计算装置,所述计算装置用于计算在所述计算装置上的所述至少一函数的每一个。
3.如权利要求2所述的方法,其特征在于:所述计算装置为以下任一种:一多核心中央处理单元(CPU)、一现场可编程门阵列(FPGA)、一图形处理单元(GPU)、一粗粒度可重构的架构(CGRA)、一智能处理单元(IPU)、一神经网络加速器、一专用集成电路(ASIC)及一量子计算机。
4.如权利要求2所述的方法,其特征在于:所述方法进一步包含:
通过一计算网格而不是所述计算装置来计算所述至少一函数。
5.如权利要求4所述的方法,其特征在于:所述计算网格包括:
一数据输入网状网络;
多个逻辑元件;及
多个多路复用器,其中所述多个逻辑元件及所述多个多路复用器形成至少一计算群组,其中所述多个逻辑元件的至少一个及所述多个多路复用器的至少一个形成所述至少一计算群组的每一个。
6.如权利要求5所述的方法,其特征在于:所述至少一函数的每一个被映射以通过所述至少一计算群组的至少一个来进行计算。
7.如权利要求5所述的方法,其特征在于:所述计算网格的所述操作进一步包含:
当所述模式指示出一函数的再次出现时,复制映射至所述函数的所述至少一个计算群组的其中一个。
8.如权利要求5所述的方法,其特征在于:所述至少一计算群组包括一第一计算群组及一第二计算群组,其中所述至少一函数包括一第一函数及一第二函数,其中所述计算网格的所述操作进一步包含:
基于所述模式来将分别映射至所述第一函数及所述第二函数的所述第一计算群组及第二计算群组重定位。
9.如权利要求5所述的方法,其特征在于:所述计算网格的所述操作进一步包含:
当没有对于一函数的调用被映射至一计算群组时,释放出所述计算群组。
10.如权利要求5所述的方法,其特征在于:所述数据输入的网状网络包括至少一馈线。
11.如权利要求1所述的方法,其特征在于:在运行时间进行所述操作。
12.一种可配置的处理架构,其特征在于:所述可配置的处理架构包含:
一计算元件,其中所述计算元件包括以下的至少一个:一计算网格及一处理单元;
一存储器,连接至所述处理单元,其中所述存储器含有多...
【专利技术属性】
技术研发人员:埃拉德·拉茲,
申请(专利权)人:涅克斯硅利康有限公司,
类型:发明
国别省市:以色列;IL
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。