当前位置: 首页 > 专利查询>英特尔公司专利>正文

用于提高执行软件的异构系统的利用率的方法和装置制造方法及图纸

技术编号:26890428 阅读:24 留言:0更新日期:2020-12-29 16:06
公开了提高执行软件的异构系统的利用率的方法、装置、系统和制品。所公开的方法、装置、系统和制品包括一种装置,包括:变体管理器,用于基于到算法的输入数据的第一大小和来自算法的输出数据的第二大小中的至少一个来确定算法是否是子算法分割SAP的候选;分割器,用于将算法分割为至少第一块和第二块;以及编译器,用于将基于第一块的第一变体和基于第二块的第二变体编译到可执行文件中,第一变体用于在异构系统的第一处理元件上执行,第二变体用于在异构系统的第二处理元件上执行。

【技术实现步骤摘要】
用于提高执行软件的异构系统的利用率的方法和装置
本公开总体上涉及处理,并且更具体地,涉及用于提高执行软件的异构系统的利用率的方法和装置。
技术介绍
计算机硬件制造商开发用于计算机平台的各种组件中使用的硬件组件。例如,计算机硬件制造商开发主板、用于主板的芯片组、中央处理单元(CPU)、批处理器(例如,设计用于批量数据的大规模并行计算的处理器)、图形处理单元(GPU)、视觉处理单元(VPU)、现场可编程门阵列(FPGA)、硬盘驱动器(HDD)、固态驱动器(SSD)和其他计算机组件。许多计算机硬件制造商开发程序和/或其他方法来编译算法和/或其他代码以用于在特定处理平台上运行。附图说明图1是图示出示例异构系统的框图。图2是图示出示例软件调整系统的框图。图3是图示出图2的变体生成器的示例实现的框图。图4是图示出图2的运行时调度器的示例实现的框图。图5A-图5E是图示出与要在异构系统上运行的算法相关联的各种示例分割策略的框图。图6是图示出在示例异构系统上执行的算法的示例运行时调度配置的框图。<本文档来自技高网...

【技术保护点】
1.一种用于提高执行软件的异构系统的利用率的装置,所述装置包括:/n变体管理器,用于基于到算法的输入数据的第一大小和来自所述算法的输出数据的第二大小中的至少一个来确定所述算法是否是子算法分割SAP的候选;/n分割器,用于将所述算法分割为至少第一块和第二块;以及/n编译器,用于将基于所述第一块的第一变体和基于所述第二块的第二变体编译到可执行文件中,所述第一变体用于在所述异构系统的第一处理元件上执行,所述第二变体用于在所述异构系统的第二处理元件上执行。/n

【技术特征摘要】
20190627 US 16/455,6281.一种用于提高执行软件的异构系统的利用率的装置,所述装置包括:
变体管理器,用于基于到算法的输入数据的第一大小和来自所述算法的输出数据的第二大小中的至少一个来确定所述算法是否是子算法分割SAP的候选;
分割器,用于将所述算法分割为至少第一块和第二块;以及
编译器,用于将基于所述第一块的第一变体和基于所述第二块的第二变体编译到可执行文件中,所述第一变体用于在所述异构系统的第一处理元件上执行,所述第二变体用于在所述异构系统的第二处理元件上执行。


2.如权利要求1所述的装置,其特征在于,当所述第一大小和所述第二大小中的至少一个满足阈值时,所述变体管理器确定所述算法是SAP的候选。


3.如权利要求1所述的装置,其特征在于,所述分割器用于基于深度神经网络将所述算法分割为至少所述第一块和所述第二块。


4.如权利要求1所述的装置,其特征在于,所述分割器用于基于第一分割策略生成所述第一块和所述第二块,所述分割器用于基于与所述第一分割策略不同的第二分割策略生成第三块和第四块。


5.如权利要求4所述的装置,其特征在于,所述第一块包括与至少到所述算法的一组输入数据相关联的第一缓冲区;并且其中当所述第三块包括至少具有到所述算法的所述一组输入数据的第二缓冲区时,所述第一变体用于在所述第一处理元件上执行以实现所述第三块。


6.如权利要求1所述的装置,其特征在于,所述第一块包括与至少到所述算法的第一组输入数据相关联的第一缓冲区,并且所述第二块包括与至少到所述算法的第二组输入数据相关联的第二缓冲区,所述第二组输入数据大于所述第一组输入数据。


7.如权利要求1所述的装置,其特征在于,所述变体管理器用于确定所述异构系统包括所述第一处理元件和所述第二处理元件。


8.一种计算机可读存储介质,包括指令,所述指令在被执行时使得至少一个处理器至少用于:
基于到算法的输入数据的第一大小和来自所述算法的输出数据的第二大小中的至少一个来确定所述算法是否是子算法分割SAP的候选;
将所述算法分割为至少第一块和第二块;以及
将基于所述第一块的第一变体和基于所述第二块的第二变体编译到可执行文件中,所述第一变体用于在异构系统的第一处理元件上执行,所述第二变体用于在所述异构系统的第二处理元件上执行。


9.如权利要求8所述的计算机可读存储介质,其特征在于,所述指令在被执行时使得所述至少一个处理器用于:当所述第一大小和所述第二大小中的至少一个满足阈值时,确定所述算法是SAP的候选。


10.如权利要求8所述的计算机可读存储介质,其特征在于,所述指令在被执行时使得所述至少一个处理器用于:基于深度神经网络将所述算法分割为至少所述第一块和所述第二块。


11.如权利要求8所述的计算机可读存储介质,其特征在于,所述指令在被执行时使得所述至少一个处理器用于:基于第一分割策略生成所述第一块和所述第二块,以及基于与所述第一分割策略不同的第二分割策略生成第三块和第四块。


12.如权利要求11所述的计算机可读存储介质,其特征在于,所述第一块包括与至少到所述算法的一组输入数据相关联的第一缓冲区;并且其中当所述第三块包括至少具有到所述算法的所述一组输入数据的第二缓冲区时,所述第一变体用于在所述第一处理元件上执行以实现所述第三块。

【专利技术属性】
技术研发人员:A·赫尔S·沙尔马M·布尔戈斯塞维尼尔J·高茨克里奇
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1