GPU虚拟机的管理方法、系统、设备和介质技术方案

技术编号:37290727 阅读:25 留言:0更新日期:2023-04-21 02:32
本发明专利技术公开了一种GPU虚拟机的管理方法、系统、设备和介质。该方法由与第一客户端关联的第一GPU服务器执行,包括:获取视频管理服务器下发的目标摄像机的第一GPU虚拟机创建任务,并根据所述第一GPU虚拟机创建任务创建与所述目标摄像机关联的第一虚拟机;根据所述第一GPU虚拟机创建任务中包括的所述第一分析任务确定目标算术逻辑单元数量;根据所述目标算术逻辑单元数量从所述第一GPU服务器中确定与所述第一虚拟机关联的目标算术逻辑单元资源,并将所述第一分析任务下发至所述目标算术逻辑单元资源进行处理。通过将GPU服务器中的计算资源进行物理层面的划分实现GPU虚拟化,保证每个视频流的分析任务可以得到实时处理,同时提升GPU的资源利用率。时提升GPU的资源利用率。时提升GPU的资源利用率。

【技术实现步骤摘要】
GPU虚拟机的管理方法、系统、设备和介质


[0001]本专利技术涉及视频分析
,尤其涉及一种GPU虚拟机的管理方法、系统、设备和介质。

技术介绍

[0002]在视频分析领域,由于海量视频流数据以及不同分析需求的存在,为了提高视频流分析效率,当前的视频智能分析方案通常将固定数量的摄像机与固定数量的GPU(GraphicsProcessingUnit,图形处理器)资源绑定,应对大量监控场景智能分析的需求。
[0003]由于GPU资源有限,为平衡不同时段和不同应用场景对GPU算力的动态需求,充分利用GPU计算潜力,引入了虚拟GPU技术,以减少分析需求的算力波动给GPU资源带来的浪费。
[0004]目前业界普遍采用的是软件层面的虚拟GPU技术,即通过在GPU实体上加载软件,在软件控制下基于时间片划分GPU资源,实现一块物理GPU芯片的多个虚拟GPU模拟。然而由于基于时间片实现资源分配是通过运行在实体GPU之上的软件调度实现的,因此存在处理延时的问题,无法满足安防监控的实时性需求;并且软件调度处理所带来的额外消耗也浪费了GPU的计算本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种GPU虚拟机的管理方法,其特征在于,由与第一客户端关联的第一GPU服务器执行,包括:获取视频管理服务器下发的目标摄像机的第一GPU虚拟机创建任务,并根据所述第一GPU虚拟机创建任务创建与所述目标摄像机关联的第一虚拟机;其中,所述第一GPU虚拟机创建任务由所述视频管理服务器根据所述第一客户端发送的对所述目标摄像机的第一分析任务进行生成;根据所述第一GPU虚拟机创建任务中包括的所述第一分析任务确定目标算术逻辑单元数量;根据所述目标算术逻辑单元数量从所述第一GPU服务器中确定与所述第一虚拟机关联的目标算术逻辑单元资源,并将所述第一分析任务下发至所述目标算术逻辑单元资源进行处理。2.根据权利要求1所述的方法,其特征在于,所述第一GPU服务器中包括至少两个实体GPU;相应的,根据所述目标算术逻辑单元数量从所述第一GPU服务器中确定与所述第一虚拟机关联的目标算术逻辑单元资源,包括:确定所述第一GPU服务器中与同一个实体GPU关联的空闲算术逻辑单元资源的数量是否大于或等于所述目标算术逻辑单元数量;若是,则从与同一个实体GPU关联的所述空闲算术逻辑单元资源中确定目标算术逻辑单元资源;否则,从与至少两个实体GPU关联的所述空闲算术逻辑单元资源中确定目标算术逻辑单元资源。3.根据权利要求1所述的方法,其特征在于,在根据所述目标算术逻辑单元数量从所述第一GPU服务器中确定与所述第一虚拟机关联的目标算术逻辑单元资源之后,所述方法还包括:按照预设周期确定所述第一虚拟机的算术逻辑单元资源消耗量;根据所述算术逻辑单元资源消耗量的变化控制所述目标算术逻辑单元资源的目标算术逻辑单元数量。4.根据权利要求1所述的方法,其特征在于,在根据所述第一GPU虚拟机创建任务创建与所述目标摄像机关联的第一虚拟机之后,所述方法还包括:获取所述视频管理服务器下发的第二客户端对所述目标摄像机的第二分析任务;将所述第二分析任务下发至与所述第一虚拟机关联的目标算术逻辑单元资源进行处理,并将所述第二分析任务的第二分析结果发送至所述第二客户端。5.一种GPU虚拟机的管理方法,其特征在于,由视频管理服务器执行,所述视频管理服务器对至少两个GPU服务器进行管理,包括:根据第一客户端发送的对目标摄像机的第一分析任务生成所述目标摄像机的第一GPU虚拟机创建任务,并将所述第一GPU虚拟机创建任务下发至与所述第一客户端关联的第一GPU服务器,以使所述第一GPU服务器根据所述第一GPU虚拟机创建任务创建与所述目标摄像机关联的第一虚拟机;在获取到第二客户端发送的对所述目标摄像机的第二分析任务后,将所述第二分析任
务下发至所述第一GPU服务器的所述第一虚拟机中,由所述第一GPU服务器将所述第二分析任务的第二分析结果发送至所述第二客户端。6.根据权利要求5所述的方法,其特征在于,在将所述第二分析任务下发至所述第一GPU服务器的所述第一...

【专利技术属性】
技术研发人员:周迪王威杰马玉杰
申请(专利权)人:浙江宇视科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1