存储资源的调度方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37664573 阅读:25 留言:0更新日期:2023-05-26 04:21
本发明专利技术公开了一种存储资源的调度方法、装置、电子设备及存储介质。其中,该方法包括:监测到前端应用发起的资源申请请求,其中,资源申请请求用于申请存储空间,且资源申请请求携带了申请量;响应于资源申请请求,基于资源申请请求携带的申请量判断在物理显存或内存中申请存储资源;将申请到的存储资源返回给前端应用进行使用。本发明专利技术解决了相关技术中对显存的利用率较低的技术问题。的利用率较低的技术问题。的利用率较低的技术问题。

【技术实现步骤摘要】
存储资源的调度方法、装置、电子设备及存储介质


[0001]本专利技术涉及显存超分
,具体而言,涉及一种存储资源的调度方法、装置、电子设备及存储介质。

技术介绍

[0002]图形处理器(Graphics Processing Unit简称GPU)可以在有限的物理GPU中提供了多任务的算力环境,在一个GPU虚拟化系统中,会创建多个任务,但是,这些算力任务使用有限的GPU资源。
[0003]现代物理显存的容量无法满足应用程序对显存需求的增长速度,对于应用程序来说显存还是会存在不够用的情况,特别是在GPU虚拟化的环境中,随着虚拟化数量的增加,物理显存已经无法满足虚拟化任务对显存的需求。由于显存是加载运行进程的代码和数据的存储,不能像CPU一样通过调度来按时间划分来使用,因此虚拟化环境只能在空间上划分显存并将其分配给每个任务使用,随着任务数量的增加,可用显存的大小会减少,最后物理显存不足导致无法再创建任务。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种存储资源的调度方法,包括:监测到前端应用发起的资源申请请求,其中,所述资源申请请求用于申请存储空间,且所述资源申请请求携带了申请量;响应于所述资源申请请求,基于所述资源申请请求携带的所述申请量判断在物理显存或内存中申请存储资源;将申请到的所述存储资源返回给所述前端应用进行使用。2.根据权利要求1所述的方法,其中,基于所述资源申请请求携带的所述申请量判断在物理显存或内存中申请存储资源,包括:判断所述物理显存的显存资源的剩余量是否低于所述申请量;如果所述显存资源的剩余量低于所述申请量,则访问所述内存,并从所述内存中申请所述存储资源;如果所述显存资源的剩余量高于或等于所述申请量,则在所述物理显存中申请所述存储资源。3.根据权利要求1或2所述的方法,其中,申请到的所述存储资源通过统一寻址模块进行管理,包括:获取申请到的所述存储资源,其中,所述存储资源包括:所述物理显存的物理地址和内存的物理地址;将所述物理显存的物理地址和所述内存的物理地址分别进行虚拟化处理,得到所述物理显存的虚拟地址和所述内存的虚拟地址;创建所述物理显存的物理地址和虚拟地址之间的第一关联关系,并创建所述内存的物理地址和虚拟地址之间的第二关联关系;将所述物理显存的虚拟地址和所述内存的虚拟地址进行缓存,写入高速缓存模块,其中,所述高速缓存模块通过缓存的所述虚拟地址加载相应的数据。4.根据权利要求3所述的方法,其中,所述虚拟地址的结构包括:至少一个索引地址和偏移量,其中,所述索引地址用于指示与对应目录关联的物理地址。5.根据权利要求4所述的方法,其中,所述方法还包括:接收到所述前端应用的数据访问请求;响应所述数据访问请求,调取所述统一寻址模块,其中,所述统一寻址模块反馈物理地址;基于反馈的物理地址访问所述高速缓存模块,得到所述高速缓存模块反馈的与所述数据访问请求匹配的数据。6.一种存储资源的调度装置,包括:监测模块,用于监测到前端应用发起的资源申请请求,其中,所述资源申请请求用于申请存储空间,且所述资源申请请求携带了申请量;处理模块,用于响应于所述资源申请请求,基于所述资源申请请求携带的所述申请量判断在物理显存或内存中申请存储资源;调取模块,用于将申请到的所述存储资源返回给所述前端应...

【专利技术属性】
技术研发人员:徐玉清康华文程军丁富强袁守正王磊胡晶范利成胡中明廖晓雪满雅文肖潇
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1