任务处理方法、装置、设备及存储介质制造方法及图纸

技术编号:32789669 阅读:47 留言:0更新日期:2022-03-23 19:50
本公开提供了一种任务处理方法,涉及数据处理技术领域,尤其涉及大数据处理技术。具体实现方案为:在第一任务使用图形处理器GPU资源中的第一显存资源,未使用所述GPU资源中的第一算力资源的情况下,保存所述第一任务所使用的所述第一显存资源的第一显存资源信息;在保存成功的情况下,释放所述第一任务所使用的所述第一显存资源。如此,提升GPU资源的利用率。率。率。

【技术实现步骤摘要】
任务处理方法、装置、设备及存储介质


[0001]本公开涉及数据处理
,尤其涉及大数据处理技术。

技术介绍

[0002]随着云计算、大数据和深度学习的发展,算力需求与日俱增。图形处理器(GPU,Graphics Processing Unit)由于浮点运算、并行计算等方面的优势,被云服务、边缘计算和终端设备广泛依赖。因此,如何提升GPU资源的利用率,成为亟待解决的问题。

技术实现思路

[0003]本公开提供了一种任务处理方法、装置、设备以及存储介质。
[0004]根据本公开的一方面,提供了一种任务处理方法,包括:
[0005]在第一任务使用GPU资源中的第一显存资源,未使用所述GPU资源中的第一算力资源的情况下,保存所述第一任务所使用的所述第一显存资源的第一显存资源信息;
[0006]在保存成功的情况下,释放所述第一任务所使用的所述第一显存资源。
[0007]根据本公开的另一方面,提供了一种任务处理装置,包括:
[0008]第一信息处理单元,用于在第一任务使用GPU资源中的第一显存资源,未使用所述GPU资源中的第一算力资源的情况下,保存所述第一任务所使用的所述第一显存资源的第一显存资源信息;
[0009]资源处理单元,用于在保存成功的情况下,释放所述第一任务所使用的所述第一显存资源。
[0010]根据本公开的另一方面,提供了一种电子设备,包括:
[0011]至少一个处理器;以及
[0012]与所述至少一个处理器通信连接的存储器;其中,
[0013]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行以上所述的方法。
[0014]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行以上所述的方法。
[0015]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现以上所述的方法。
[0016]这样,本公开方案能够在任务使用GPU资源中的显存资源但未使用所述GPU资源中的算力资源的情况下,主动释放任务所使用的第一显存资源,即主动释放GPU资源的使用权限,所以,有效避免了资源占用但不使用的情况,避免了资源浪费,同时,提升了GPU资源的利用率。
[0017]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0018]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0019]图1是根据本公开实施例任务处理方法的实现流程示意图;
[0020]图2是根据本公开实施例任务处理方法在一具体示例中的流程示意图;
[0021]图3是根据本公开实施例任务处理方法在另一具体示例中的流程示意图;
[0022]图4是根据本公开实施例任务处理装置的结构示意图;
[0023]图5是用来实现本公开实施例的任务处理方法的电子设备的框图。
具体实施方式
[0024]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0025]应用程序,也可称为任务,会存在使用大块显存或者独占整张GPU的显卡的情况,但是,实际使用中,应用程序会一直占用GPU资源的显存资源,但只有部分时间会使用到GPU资源中的算力资源进行计算,而其他时间可能在进行CPU任务或者在等待数据输入,显然,造成了算力资源的极大浪费。
[0026]基于此,本公开方案提供了一种GPU分时复用的方案,可以应用在GPU虚拟化领域,更好地实现多个GPU任务的分时混布,如此,提高了GPU资源的利用率。具体地,本公开方案为了提高GPU资源的利用率,采用GPU分时复用的方法,在任务处于算力资源闲置的状态下,保护任务的显存现场(也即显存资源的相关信息)并交出(也即释放)GPU资源的使用权限,以供其他GPU任务使用;在需要恢复使用的情况下,再获取GPU资源的使用权限,并恢复显存现场,同时保持任务不退出,这样,实现GPU任务的热切换,实现多个GPU任务的分时复用。
[0027]具体流程,如图1所示,本公开方案提供了一种任务处理方法,包括:
[0028]步骤S101:在第一任务使用GPU资源中的第一显存资源,未使用所述GPU资源中的第一算力资源的情况下,保存所述第一任务所使用的所述第一显存资源的第一显存资源信息。
[0029]这里,所述第一任务也可称为第一GPU任务,即该第一任务的运行需要使用GPU资源,所述GPU资源可以具体包括算力资源和显存资源。
[0030]可以理解的是,以上所述的第一任务使用GPU资源中的第一显存资源未使用所述GPU资源中的第一算力资源,即相当于第一任务处于算力资源闲置状态。以上所述的保存所述第一任务所使用的所述第一显存资源的第一显存资源信息,即相当于保存所述第一任务的显存现场,也即保持第一任务不退出。
[0031]在一具体示例中,所述第一任务先在CPU中启动运行,并获取GPU的使用权限,即获取第一任务正常运行所需要的GPU资源的算力资源和显存资源,以基于所述GPU资源的算力资源和显存资源处理所述第一任务。
[0032]步骤S102:在保存成功的情况下,释放所述第一任务所使用的所述第一显存资源。
[0033]需要说明的是,在第一任务释放掉所述第一任务所使用的第一显存资源后,即相当于释放掉了所述GPU资源的使用权限,如此,便于其他任务使用所述GPU资源。
[0034]这样,本公开方案在第一任务处于算力资源闲置状态的情况下,保存所述第一任务所使用的显存资源的相关信息,即保存所述第一任务所使用的第一显存资源的第一显存资源信息,进而释放掉所述第一任务所使用的第一显存资源,也就是说,在所述第一任务处于算力资源闲置状态的情况下,即会释放掉所使用的第一显存资源,也即释放掉GPU的使用权限,如此,便于其他任务使用所述GPU资源,有效避免了资源占用但不使用的情况,提升了GPU资源的利用率。
[0035]在本公开方案的一具体示例中,可以采用以下方式来保存第一任务所使用显存资源的相关信息,具体地,以上所述的保存所述第一任务所使用的所述第一显存资源的第一显存资源信息,具体包括:将所述第一任务所使用的所述第一显存资源的第一显存资源信息保存至所述GPU之外的存储介质中。举例来说,将所述第一显存资源的第一显存资源信息保存至内存或磁盘等,如此,确保所述第一任务不退出,为后续第一任务恢复现场(即重新使用第一显存资源,并在重新使用所述第一显存资源的基础上,继本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种任务处理方法,包括:在第一任务使用图形处理器GPU资源中的第一显存资源,未使用所述GPU资源中的第一算力资源的情况下,保存所述第一任务所使用的所述第一显存资源的第一显存资源信息;在保存成功的情况下,释放所述第一任务所使用的所述第一显存资源。2.根据权利要求1所述的方法,其中,所述保存所述第一任务所使用的所述第一显存资源的第一显存资源信息,包括:将所述第一任务所使用的所述第一显存资源的第一显存资源信息保存至所述GPU之外的存储介质中。3.根据权利要求1或2所述的方法,还包括:发送释放所述第一显存资源的第一资源释放信号。4.根据权利要求3所述的方法,还包括:在发送所述第一资源释放信号之后,存在等待获取所述GPU资源的第二任务的情况下,触发所述第二任务获取所述GPU资源。5.根据权利要求4所述的方法,其中,所述第二任务为不能与所述第一任务同时使用所述GPU资源的任务。6.根据权利要求4或5所述的方法,还包括:发送所述第一任务需要恢复使用所述GPU资源的第一资源恢复信号。7.根据权利要求6所述的方法,还包括:在基于所述GPU资源处理所述第二任务的情况下,响应于针对所述第一任务的所述第一资源恢复信号,触发所述第二任务停止使用所述GPU资源的第二算力资源;在停止使用所述GPU资源的第二算力资源的情况下,保存所述第二任务所使用的第二显存资源的第二显存资源信息;在保存成功的情况下,释放所述第二任务所使用的所述第二显存资源。8.根据权利要求7所述的方法,其中,所述第二任务的优先级低于所述第一任务的优先级。9.根据权利要求4或5或6所述的方法,还包括:在所述第二任务使用所述GPU资源中的第二显存资源,未使用所述GPU资源中的第二算力资源的情况下,保存所述第二任务所使用的所述第二显存资源的第二显存资源信息;在保存成功的情况下,释放所述第二任务所使用的所述第二显存资源。10.根据权利要求9所述的方法,还包括:发送释放所述第二显存资源的第二资源释放信号。11.根据权利要求7至10任一项所述的方法,还包括:在所述第二任务释放所述第二显存资源的情况下,将所述第一显存资源信息拷贝到所述GPU资源中;基于所述第一显存资源以及所述第一算力资源继续处理所述第一任务。12.一种任务处理装置,包括:第一信息处理单元,用于在第一任务使用GPU资源中的第一显存资源,未使用所述GPU资源中的第一算力资源的情况下,保存所述第一任务所使用的所述第一显存资源的第一显存资源信息;
资源处理单元,用于在保存成功的情况下,释放所述第一任务所使用的所述第一显存资源。13.根据权利要求12所述的装置,其中,所述第一信息处理单元,具体用于将所述第一任务所使用的所述第一显存资源的第一显存资源信息保存至所述GPU之外的存储...

【专利技术属性】
技术研发人员:李勇李志黎世勇
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1