一种管理异构计算节点的方法及装置制造方法及图纸

技术编号:41973241 阅读:11 留言:0更新日期:2024-07-10 16:52
本发明专利技术涉及OpenStack云计算技术领域,具体提供了一种管理异构计算节点的方法及装置,拓展nova服务的计算节点代理功能,通过后端驱动获取到对应计算节点的供应商、架构信息和计算节点的CPU特性的信息,并将所述信息存储到compute_nodes数据表中,进行记录。与现有技术相比,本发明专利技术能够简化纳管不同架构、不同微架构的服务器的复杂度,提供了必要的API方便按照用户的要求创建必要的虚拟机。

【技术实现步骤摘要】

本专利技术涉及openstack云计算,具体提供一种管理异构计算节点的方法及装置


技术介绍

1、openstack起源于云计算,发展日新月异,非常迅猛。iaas(基础设施即服务)是目前云服务商提供最多的云服务,而openstack是其最为典型的代表。openstack作为一个大型云操作系统,控制计算、网络、存储三大资源,提供web端的可视化界面方便管理员控制,采取身份认证机制给予用户权限和资源,有其标准的基础架构及服务功能,但也有其他组件以提供其他服务,保证用户应用程序的高可用性。

2、异构云是一个新兴的名词,根据不同的背景其含义也有不同,主要包括:

3、(1)因设备利旧而导致的不同计算节点的cpu和内存等设备的不同,通常会影响虚拟机的热迁移或者虚拟机的性能等。

4、(2)信创服务器和非信创服务器的混合部署;

5、(3)服务器装配有gpu、npu、fpga等类型的加速卡,目前随着摩尔定律在cpu上已经到达了瓶颈,弱化通用性,而强化特种场景使用的gpu、npu、fpga等设备越来越吸引了开发者的注意,随着包括大模型在内的深度学习的不断发展,gpu、npu等能提供较大算力的设备也越来越收到重视,而云平台也应具备支持虚拟机使用这些设备的能力,并应尽可能的提供与普通虚拟机相类似的使用体验。

6、当前openstack针对异构云的场景还存在一些不足:

7、(1)不能通过计算节点的cpu供应商进行调度,无法区分intel、amd和海光节点;

8、(2)可以支持不同型号、不同架构cpu的迁移,但是需要配置各种主机聚合或者限制cpu的模型,配置复杂;若没有配置,则迁移大概率有问题,需要平台管理员手动指定节点;

9、(3)云平台的管理员无法为虚拟机指定cpu模型,虚拟机在不同计算节点上启动可能使用不同的cpu模型,对专业用户并不友好;

10、(4)在使用cyborg的情况下,针对不同类型的gpu、npu需要配置不同的驱动,延长了研发周期。


技术实现思路

1、本专利技术是针对上述现有技术的不足,提供一种实用性强的管理异构计算节点的方法。

2、本专利技术进一步的技术任务是提供一种设计合理,安全适用的管理异构计算节点的装置。

3、本专利技术解决其技术问题所采用的技术方案是:

4、一种管理异构计算节点的方法,拓展nova服务的计算节点代理功能,通过后端驱动获取到对应计算节点的供应商、架构信息和计算节点的cpu特性的信息,并将所述信息存储到compute_nodes数据表中,进行记录。

5、进一步的,在计算节点的代理模式配置为custom的情况下,计算节点支持配置cpu模型列表,所述cpu模型列表表示计算节点允许配置的cpu模型的类型,cpu模型指代了一组cpu特性和cpu供应商的组合;

6、对计算节点代理的模式增加配置auto,当配置为auto时,所述计算节点支持所有可用的cpu模型,并将这些支持的cpu模型的名称也记录到数据库中。

7、进一步的,在api的数据库中,增加一个记录cpu模型的表,计算节点的代理服务启动的过程中,查询cpu模型记录,如果没有模型名称没有记录,则将cpu模型名称及对应的cpu特性的列表记录到数据库中.

8、进一步的,计算节点的代理服务也需要将支持的cpu模型和cpu特性,通过异步rpc的方式上传到调度服务中,由调度服务对数据进行记录;

9、同时根据属性和模型组合进行去重,各相同节点的数据仅需要记录一份即可。

10、进一步的,拓展cyborg的计算节点代理的功能,增加一种通用的pci设备的驱动,对于类型为加速设备、vga兼容设备的pci设备进行上报,平台管理员配置设备的白名单或者黑名单,保留符合要求的设备或者排除不符合要求的设备,所述设备的信息将会被记录到placement中;

11、在placement服务创建resource provider子节点,并配置trait,trait的形式为pci_device_{vendor_id}_{device_id}和pci_device_{subsystem_vendor}_{subsystem_device}。

12、进一步的,在创建虚拟机时通过镜像、flavor配置虚拟机所需要的cpu模型类型信息,也支持在接口中传入虚拟机所需的cpu模型的信息,并将信息记录到虚拟机的instance_extra和request_specs两张表中,以供之后的调度所使用。

13、进一步的,拓展调度器的组件,增加一个cpufeaturefilter,filter根据虚拟机配置的cpu模型信息,进行选择到符合条件的节点,筛选的逻辑为首先获取到配置的cpu模型信息,然后遍历所有的待选的计算节点,查看用户指定的cpu模型是否是计算节点所支持的,如果不支持,则忽略该计算节点;

14、若支持,且用户没有配置cpu属性的特殊要求则返回支持;

15、若用用户也指定虚拟机需禁用或者支持cpu特性的列表,则需首先将cpu模型解析为cpu特性的数组,信息从数据库中查询到,或从配置中查询到,然后将相应的在特性列表中对相关的特性进行添加和删除,删除掉禁用的特性、增加需要的特性,最后查询到计算节点对应的cpu特性信息;

16、若用户没有配置cpu模型,则用户当前传入的cpu特性列表即为用户要求的cpu特性的列表,将用户要求的特性减去计算节点支持的特性;

17、如果结果非空则需跳过计算节点,否则节点可用;

18、若传入的request_specs中没有cpu模型信息,则跳过这个过滤器。

19、进一步的,对于已经创建完成的虚拟机,即使用户没有配置cpu模型也需要根据虚拟机当前所使用的信息,在热迁移时进行调度;

20、在调用管理服务接口之前,首先访问计算节点的代理服务,由计算节点的代理服务访问后端驱动获取到具体的cpu模型和cpu特性的信息,并将cpu模型数据解析为cpu特性列表,并删除和增加显示配置的特性,并返回给conductor服务,conductor服务将信息暂存在request_specs表对应的对象中,不需要存储在数据库;

21、然后将对象传入到调度服务,调度服务器涉及到的筛选器即可根据配置的信息进行特定节点的筛选。

22、进一步的,若用户需要特定cpu供应商的设备,则平台管理员在虚拟机的镜像或者flavor中配置hw_cpu_vendor,并将vendor配置为满足需要的类型,这样cpufilter在过滤过程中,通过获取request_spec中的元数据,对比待选计算节点的vendor信息是否满足要求,若不满足则退出,淘汰待选的计算节点。

23、一种管理异构计算节点的装置,包括:至少一个存储器和至少一个处理器;

24、所述至少一个存储器,本文档来自技高网...

【技术保护点】

1.一种管理异构计算节点的方法,其特征在于,拓展nova服务的计算节点代理功能,通过后端驱动获取到对应计算节点的供应商、架构信息和计算节点的CPU特性的信息,并将所述信息存储到compute_nodes数据表中,进行记录。

2.根据权利要求1所述的一种管理异构计算节点的方法,其特征在于,在计算节点的代理模式配置为custom的情况下,计算节点支持配置CPU模型列表,所述CPU模型列表表示计算节点允许配置的CPU模型的类型,CPU模型指代了一组CPU特性和CPU供应商的组合;

3.根据权利要求2所述的一种管理异构计算节点的方法,其特征在于,在API的数据库中,增加一个记录CPU模型的表,计算节点的代理服务启动的过程中,查询CPU模型记录,如果没有模型名称没有记录,则将CPU模型名称及对应的CPU特性的列表记录到数据库中。

4.根据权利要求3所述的一种管理异构计算节点的方法,其特征在于,计算节点的代理服务也需要将支持的CPU模型和CPU特性,通过异步RPC的方式上传到调度服务中,由调度服务对数据进行记录;

5.根据权利要求4所述的一种管理异构计算节点的方法,其特征在于,拓展cyborg的计算节点代理的功能,增加一种通用的PCI设备的驱动,对于类型为加速设备、VGA兼容设备的PCI设备进行上报,平台管理员配置设备的白名单或者黑名单,保留符合要求的设备或者排除不符合要求的设备,所述设备的信息将会被记录到placement中;

6.根据权利要求5所述的一种管理异构计算节点的方法,其特征在于,在创建虚拟机时通过镜像、Flavor配置虚拟机所需要的CPU模型类型信息,也支持在接口中传入虚拟机所需的CPU模型的信息,并将信息记录到虚拟机的instance_extra和request_specs两张表中,以供之后的调度所使用。

7.根据权利要求6所述的一种管理异构计算节点的方法,其特征在于,拓展调度器的组件,增加一个CPUFeatureFilter,Filter根据虚拟机配置的CPU模型信息,进行选择到符合条件的节点,筛选的逻辑为首先获取到配置的CPU模型信息,然后遍历所有的待选的计算节点,查看用户指定的CPU模型是否是计算节点所支持的,如果不支持,则忽略该计算节点;

8.根据权利要求7所述的一种管理异构计算节点的方法,其特征在于,对于已经创建完成的虚拟机,即使用户没有配置CPU模型也需要根据虚拟机当前所使用的信息,在热迁移时进行调度;

9.根据权利要求8所述的一种管理异构计算节点的方法,其特征在于,若用户需要特定CPU供应商的设备,则平台管理员在虚拟机的镜像或者Flavor中配置hw_cpu_vendor,并将vendor配置为满足需要的类型,这样CPUFilter在过滤过程中,通过获取request_spec中的元数据,对比待选计算节点的vendor信息是否满足要求,若不满足则退出,淘汰待选的计算节点。

10.一种管理异构计算节点的装置,其特征在于,包括:至少一个存储器和至少一个处理器;

...

【技术特征摘要】

1.一种管理异构计算节点的方法,其特征在于,拓展nova服务的计算节点代理功能,通过后端驱动获取到对应计算节点的供应商、架构信息和计算节点的cpu特性的信息,并将所述信息存储到compute_nodes数据表中,进行记录。

2.根据权利要求1所述的一种管理异构计算节点的方法,其特征在于,在计算节点的代理模式配置为custom的情况下,计算节点支持配置cpu模型列表,所述cpu模型列表表示计算节点允许配置的cpu模型的类型,cpu模型指代了一组cpu特性和cpu供应商的组合;

3.根据权利要求2所述的一种管理异构计算节点的方法,其特征在于,在api的数据库中,增加一个记录cpu模型的表,计算节点的代理服务启动的过程中,查询cpu模型记录,如果没有模型名称没有记录,则将cpu模型名称及对应的cpu特性的列表记录到数据库中。

4.根据权利要求3所述的一种管理异构计算节点的方法,其特征在于,计算节点的代理服务也需要将支持的cpu模型和cpu特性,通过异步rpc的方式上传到调度服务中,由调度服务对数据进行记录;

5.根据权利要求4所述的一种管理异构计算节点的方法,其特征在于,拓展cyborg的计算节点代理的功能,增加一种通用的pci设备的驱动,对于类型为加速设备、vga兼容设备的pci设备进行上报,平台管理员配置设备的白名单或者黑名单,保留符合要求的设备或者排除不符合要求的设备,所述设备的信息将会被记录到placement中;

6.根据权利要求...

【专利技术属性】
技术研发人员:申嘉童孙兴艳谈果戈宋洪圆
申请(专利权)人:浪潮云信息技术股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1