System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 内核执行方法、装置、电子设备和存储介质制造方法及图纸_技高网

内核执行方法、装置、电子设备和存储介质制造方法及图纸

技术编号:41070710 阅读:5 留言:0更新日期:2024-04-24 11:26
本发明专利技术提供一种内核执行方法、装置、电子设备和存储介质,其中方法包括:确定第一内核和第二内核,所述第二内核由编译器拆分为第一部分和第二部分,所述第一部分与所述第一内核执行所产生的数据无关,所述第二部分与所述第一内核执行所产生的数据相关;执行所述第一内核,并在所述第一内核的执行过程中,执行所述第一部分;在所述第一内核执行完成、且所述第一部分执行完成后,执行所述第二部分。本发明专利技术提供的方法、装置、电子设备和存储介质,缩短了第一内核和第二内核两个内核的整体执行时间,提高了两个内核的整体执行效率。并且,基于编译器拆分第二内核,无需人工干预,大大降低了内核执行方法的应用门槛,提高了内核执行方法的适用范围。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及一种内核执行方法、装置、电子设备和存储介质


技术介绍

1、数据流(stream)作为按照顺序执行的命令序列,常用于管理内核(kernel)的并发操作。

2、目前,位于同一数据流中的多个内核之间通常存在依赖(dependency)关系,具体体现为后一个内核依赖于前一个内核执行产生的数据,因此多个内核需要按照顺序逐个执行,即,需要前一个内核执行完毕之后,后一个内核才会启动(launch),由此导致多个内核的整体执行时间较长,整体执行效率较低。


技术实现思路

1、本专利技术提供一种内核执行方法、装置、电子设备和存储介质,用以解决现有技术中多个内核顺序执行的整体效率低下的缺陷。

2、本专利技术提供一种内核执行方法,包括:

3、确定第一内核和第二内核,所述第二内核由编译器拆分为第一部分和第二部分,所述第一部分与所述第一内核执行所产生的数据无关,所述第二部分与所述第一内核执行所产生的数据相关;

4、执行所述第一内核,并在所述第一内核的执行过程中,执行所述第一部分;

5、在所述第一内核执行完成、且所述第一部分执行完成后,执行所述第二部分。

6、根据本专利技术提供的一种内核执行方法,所述第二内核的拆分步骤包括:

7、基于所述编译器对所述第二内核进行指令检测;

8、基于检测所得的数据加载指令在所述第二内核中的位置,对所述第二内核进行拆分,得到所述第一部分和所述第二部分。p>

9、根据本专利技术提供的一种内核执行方法,所述基于检测所得的数据加载指令在所述第二内核中的位置,对所述第二内核进行拆分,得到所述第一部分和所述第二部分,包括:

10、在所述第二内核的所述数据加载指令前插入同步指令,将所述第二内核中所述同步指令之前的部分作为所述第一部分,将所述第二内核中所述同步指令之后的部分作为所述第二部分。

11、根据本专利技术提供的一种内核执行方法,所述在所述第一内核的执行过程中,执行所述第一部分,包括:

12、在所述第一内核的执行过程中,执行所述第二内核的预加载,并在所述第二内核的预加载完成后,执行所述第一部分;

13、所述预加载用于加载内核执行所需的数据。

14、根据本专利技术提供的一种内核执行方法,所述执行所述第一内核,包括:

15、执行所述第一内核的预加载,并在所述第一内核的预加载完成后,执行所述第一内核;

16、所述执行所述第二内核的预加载,包括:

17、在开始执行所述第一内核的同时,开始执行所述第二内核的预加载。

18、根据本专利技术提供的一种内核执行方法,所述第一内核的执行过程由所述第一内核中的结束指令的执行拆分为第一执行过程和第二执行过程;

19、所述执行所述第一部分,包括:

20、在所述第一执行过程完成后,同时开始所述第二执行过程和执行所述第一部分。

21、根据本专利技术提供的一种内核执行方法,所述在所述第一内核执行完成、且所述第一部分执行完成后,执行所述第二部分,包括:

22、在所述第一内核执行完成后,对所述第一内核和所述第二内核进行同步,在同步完成后,顺序执行所述第一部分和所述第二部分,或触发所述第二部分的执行。

23、本专利技术还提供一种内核执行装置,包括:

24、内核确定单元,用于确定第一内核和第二内核,所述第二内核由编译器拆分为第一部分和第二部分,所述第一部分与所述第一内核执行所产生的数据无关,所述第二部分与所述第一内核执行所产生的数据相关;

25、第一执行单元,用于执行所述第一内核,并在所述第一内核的执行过程中,执行所述第一部分;

26、第二执行单元,用于在所述第一内核执行完成、且所述第一部分执行完成后,执行所述第二部分。

27、本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述内核执行方法。

28、本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述内核执行方法。

29、本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述内核执行方法。

30、本专利技术提供的内核执行方法、装置、电子设备和存储介质,通过编译器将第二内核拆分为第一部分和第二部分,以使第二内核的第一部分能够在第一内核的执行过程中执行,由此消除了第一内核和第二内核在执行上的时间间隔,并且压缩了第二内核执行所需的时间,进而缩短了第一内核和第二内核两个内核的整体执行时间,提高了两个内核的整体执行效率。并且,基于编译器拆分第二内核,无需人工干预,大大降低了内核执行方法的应用门槛,提高了内核执行方法的适用范围。

本文档来自技高网...

【技术保护点】

1.一种内核执行方法,其特征在于,包括:

2.根据权利要求1所述的内核执行方法,其特征在于,所述第二内核的拆分步骤包括:

3.根据权利要求2所述的内核执行方法,其特征在于,所述基于检测所得的数据加载指令在所述第二内核中的位置,对所述第二内核进行拆分,得到所述第一部分和所述第二部分,包括:

4.根据权利要求1所述的内核执行方法,其特征在于,所述在所述第一内核的执行过程中,执行所述第一部分,包括:

5.根据权利要求4所述的内核执行方法,其特征在于,所述执行所述第一内核,包括:

6.根据权利要求1至5中任一项所述的内核执行方法,其特征在于,所述第一内核的执行过程由所述第一内核中的结束指令的执行拆分为第一执行过程和第二执行过程;

7.根据权利要求1至5中任一项所述的内核执行方法,其特征在于,所述在所述第一内核执行完成、且所述第一部分执行完成后,执行所述第二部分,包括:

8.一种内核执行装置,其特征在于,包括:

9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述内核执行方法。

10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述内核执行方法。

11.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述内核执行方法。

...

【技术特征摘要】

1.一种内核执行方法,其特征在于,包括:

2.根据权利要求1所述的内核执行方法,其特征在于,所述第二内核的拆分步骤包括:

3.根据权利要求2所述的内核执行方法,其特征在于,所述基于检测所得的数据加载指令在所述第二内核中的位置,对所述第二内核进行拆分,得到所述第一部分和所述第二部分,包括:

4.根据权利要求1所述的内核执行方法,其特征在于,所述在所述第一内核的执行过程中,执行所述第一部分,包括:

5.根据权利要求4所述的内核执行方法,其特征在于,所述执行所述第一内核,包括:

6.根据权利要求1至5中任一项所述的内核执行方法,其特征在于,所述第一内核的执行过程由所述第一内核中的结束指令的执行拆分为第一执行过程和第二执行过程;<...

【专利技术属性】
技术研发人员:请求不公布姓名请求不公布姓名
申请(专利权)人:上海壁仞科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1