内核优化和延迟执行制造技术

技术编号:37246422 阅读:18 留言:0更新日期:2023-04-20 23:26
本公开涉及内核优化和延迟执行。包括至少一个动态可配置参数的内核由处理器提交。内核将在稍后被执行。提交内核后接收数据。基于数据更新内核的至少一个动态可配置参数。在至少一个动态可配置参数已被更新之后执行具有至少一个更新的动态可配置参数的内核。少一个更新的动态可配置参数的内核。少一个更新的动态可配置参数的内核。

【技术实现步骤摘要】
内核优化和延迟执行


[0001]至少一个实施例涉及根据本文描述的各种新颖技术的内核优化和执行。例如,在图形处理单元上执行先前提交的内核之前,代理可以根据本文描述的各种新颖技术修改图形处理单元上的内核的内核参数。

技术介绍

[0002]内核的优化需要了解与内核相关联的应用程序的需求以及内核将在其上操作的信息(例如,数据)。数据可以来自计算机系统内部或来自计算机系统外部(例如,通过网络来自远程计算机系统)。通常,在将内核提交给处理器执行之前,应该知道要用于内核的数据。如果在内核提交给处理器(例如,图形处理单元(GPU))时数据是已知的,则可以根据已知数据优化该内核以执行。但是,在某些情况下,在内核提交时要在内核中使用的数据是未知的。例如,在某些情况下,可以在提交内核之后通过网络接口接收数据,在这种情况下,可能无法在提交内核时选择优化的参数以用于内核的执行。这可能导致内核效率低下,其中要么已将太多资源提交给内核,要么已提交给内核的资源太少。或者,应用程序可能会等到收到数据后再提交内核,这会引入内核的提交和执行上的延迟。
图说明
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种方法,包括:由处理器提交包括至少一个动态可配置参数的内核,其中所述内核将在稍后时间执行;在所述内核已被提交后接收数据;基于所述数据,更新所述内核的所述至少一个动态可配置参数;以及使具有至少一个更新的动态可配置参数的所述内核在所述至少一个动态可配置参数被更新之后执行。2.如权利要求1所述的方法,其中提交所述内核包括设置与所述内核相关联的等待执行标志,所述方法还包括:由所述处理器接收所述内核的所述至少一个动态可配置参数的第一存储器位置或所述等待执行标志的第二存储器位置中的至少一个。3.如权利要求2所述的方法,其中执行所述内核包括重置与所述内核相关联的等待执行标志。4.如权利要求2所述的方法,还包括:将所述第一存储器位置或所述第二存储器位置中的至少一个发送到网络接口控制器,其中所述网络接口控制器接收所述数据,更新所述内核的所述至少一个动态可配置参数,并使所述内核执行。5.如权利要求1所述的方法,其中所述数据包括消息,所述消息具有包括报头信息的报头和包括消息内容的主体,其中所述报头信息用于更新所述至少一个动态可配置参数,并且所述主体用于使得所述内核在所述至少一个动态可配置参数被更新后执行。6.如权利要求1所述的方法,其中所述至少一个动态可配置参数包括数据大小参数、数据类型参数、线程数参数或存储器量参数中的至少一个。7.如权利要求1所述的方法,其中所述内核被提交给图形处理单元并在所述图形处理单元上执行。8.一种系统,包括:第一处理设备;第二处理设备,其可操作地耦合到所述第一处理设备,其中所述第二处理设备用于将包括至少一个动态可配置参数的内核提交给所述第一处理设备以供在稍后时间执行;以及第三设备,其可操作地耦合到所述第一处理设备和所述第二处理设备,其中所述第三设备用于:在所述内核已被提交后接收数据;基于所述数据更新所述内核的至少一个动态可配置参数;以及使得具有至少一个更新的动态可配置参数的所述内核在所述至少一个动态可配置参数已被更新之后执行。9.如权利要求8所述的系统,其中所述第一处理设备是图形处理单元,所述第二处理设备是中央处理单元,并且所述第三设备是网络接口控制器,并且其中所述网络接口控制器用于通过网络连接从远程系统接收所述数据。10.如权利要求8所述的系统,其中由所述第二处理设备提交所述内核包括设置与所述内核相关联的等待执行标志,其中所述第三设备进一步用于:
接...

【专利技术属性】
技术研发人员:S
申请(专利权)人:迈络思科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1