System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 运行时持续的QoS和优化的资源效率制造技术_技高网

运行时持续的QoS和优化的资源效率制造技术

技术编号:40358504 阅读:10 留言:0更新日期:2024-02-09 14:44
本公开涉及运行时持续的QoS和优化的资源效率。提供了用于维持如高性能计算(HPC)系统等计算系统中资源的期望使用效率连同与由该资源执行的应用的性能相关联的期望的服务质量(QoS)的系统和方法。可以一起考虑效率和QoS,并且所提供的系统和方法在应用运行时期间对两者进行优化。

【技术实现步骤摘要】


技术介绍

1、超级计算曾经专属于政府或医学研究人员、高成本电影制作人等。然而,随着诸如人工智能或机器学习(其可能需要大规模的并行计算(mpc)计算能力)等数据密集型技术的实施和使用变得更加普遍,更多的实体和用户正在探索高性能计算(“hpc”)应用或解决方案。这些应用或解决方案可以在例如超级计算机、集群和云等各种平台上运行,并且用于如医学成像、金融服务、分子生物学、能源、宇宙学、地球物理学、制造和数据仓库等各种领域。影响hpc应用的常见挑战是这些hpc应用需要在多个处理器或处理器核之间加速(例如,以每秒万亿次浮点运算每秒或每秒千万亿次浮点运算)处理大量数据。

2、术语“云计算”通常表示使用由第三方通过私有或公共网络提供的相对大量的计算资源。例如,企业实体可能有其期望存储、访问和处理的大量数据,但无需为这些目的构建其自己的计算基础设施。于是,企业实体可能会租赁或以其他方式支付属于第三方(或者在此上下文中为“云提供商”)的计算资源。在此上下文中,企业实体是云提供商的“客户”。在一些情况下,云提供商可能通过互联网的万维网向企业实体提供计算资源。hpc应用或解决方案通常利用云。


技术实现思路

【技术保护点】

1.一种方法,包括:

2.如权利要求1所述的方法,进一步包括:通过在所述工作流所属的应用的运行时期间监测QoS和效率来创建所述历史EQ评级度量,以创建历史时间序列数据集,其中,效率是基于对所述一个或多个资源的使用的。

3.如权利要求2所述的方法,进一步包括:利用所述历史时间序列数据集来训练预测EQ算法,以得到预测所述适用的EQ评级的机器学习模型。

4.如权利要求3所述的方法,进一步包括:外推由所述机器学习模型识别的与所述预测的工作负载资源需求相称的关系趋势,其中,所述效率和所述QoS是彼此的函数。

5.如权利要求1所述的方法,进一步包括:通过将表示所述工作流的算法或数据集元数据中的至少一个的计算复杂度与和当前工作负载相当的历史工作负载相关联的计算复杂度进行比较,来确定与所述算法或所述数据集元数据中的所述至少一个相关联的所述计算复杂度,并且将所述确定的EQ评级指定为和与所述相当的历史工作负载相关联的EQ评级相当的EQ评级。

6.如权利要求1所述的方法,其中,预测所述工作负载资源需求包括:在工作流的一个或多个阶段将付费QoS值与历史或估计的工作负载资源使用相结合。

7.如权利要求1所述的方法,其中,预测所述工作负载资源需求包括:凭借静态QoS来维护所述适用的EQ评级,所述静态QoS构成了通过调度所述一个或多个资源的使用而满足的所述适用的EQ评级,所述一个或多个资源是基于贯穿工作流的一个或多个阶段的所述预测的工作负载资源需求来分配的。

8.如权利要求1所述的方法,其中,提供所述运行时持续的QoS包括:在所述工作流的运行时期间跟踪平均QoS,并且其中,动态地再分配所述一个或多个资源包括:在所述平均QoS小于付费QoS时提高所述运行时持续的QoS。

9.如权利要求8所述的方法,其中,提供所述运行时持续的QoS包括:在所述工作流的运行时期间跟踪所述平均QoS,并且其中,动态地再分配所述一个或多个资源包括:在所述平均QoS大于所述付费QoS时降低所述运行时持续的QoS。

10.如权利要求1所述的方法,其中,提供所述运行时持续的QoS包括:在所述工作流的运行时期间跟踪平均QoS,并且通过与所述计算系统的使用相关联的折扣计费来使所述平均QoS与付费QoS同步。

11.一种方法,包括:

12.如权利要求11所述的方法,进一步包括:通过在所述工作流所属的应用的运行时期间监测QoS和关于所述一个或多个资源的使用的效率来创建所述历史EQ评级度量,以创建历史时间序列数据集。

13.如权利要求12所述的方法,进一步包括:利用所述历史时间序列数据集来训练预测EQ算法,以得到在执行所述工作流期间预测所述EQ评级的机器学习模型。

14.如权利要求13所述的方法,进一步包括:外推由所述机器学习模型识别的与所述预测的工作负载资源需求相称的关系趋势,其中,所述效率和所述QoS是彼此的函数。

15.如权利要求11所述的方法,进一步包括:通过将表示所述工作流的算法或数据集元数据中的至少一个的计算复杂度与和当前工作负载相当的历史工作负载相关联的计算复杂度进行比较,来确定与所述算法或所述数据集元数据中的所述至少一个相关联的所述计算复杂度,并且将所述确定的EQ评级指定为和与所述相当的历史工作负载相关联的EQ评级相当的EQ评级。

16.一种高性能计算(HPC)系统,包括:

17.如权利要求16所述的HPC系统,其中,所述存储器单元包括进一步使所述处理器利用历史时间序列数据集来训练预测EQ算法以得到预测适用的EQ评级的机器学习模型的代码。

18.如权利要求17所述的HPC系统,其中,所述存储器单元包括进一步使所述处理器外推由所述机器学习模型识别的与所述预测的工作负载资源需求相称的关系趋势的代码,其中,所述效率和所述QoS是彼此的函数。

19.如权利要求16所述的HPC系统,进一步包括:通过将表示所述一个或多个工作流的算法或与所述一个或多个工作流相关联的数据集元数据中的至少一个的计算复杂度与和当前工作负载相当的历史工作负载相关联的计算复杂度进行比较,来确定与所述算法或所述数据集元数据中的所述至少一个相关联的所述计算复杂度,并且将所述确定的EQ评级指定为和与所述相当的历史工作负载相关联的EQ评级相当的EQ评级。

20.如权利要求16所述的HPC系统,其中,维持所述QoS水平包括:在所述一个或多个工作流的运行时期间跟踪平均QoS,并且其中,动态地再分配所述一个或多个资源包括以下之一:在所述平均QoS小于付费QoS时提高所述QoS水平,并且在所述平均QoS大于...

【技术特征摘要】

1.一种方法,包括:

2.如权利要求1所述的方法,进一步包括:通过在所述工作流所属的应用的运行时期间监测qos和效率来创建所述历史eq评级度量,以创建历史时间序列数据集,其中,效率是基于对所述一个或多个资源的使用的。

3.如权利要求2所述的方法,进一步包括:利用所述历史时间序列数据集来训练预测eq算法,以得到预测所述适用的eq评级的机器学习模型。

4.如权利要求3所述的方法,进一步包括:外推由所述机器学习模型识别的与所述预测的工作负载资源需求相称的关系趋势,其中,所述效率和所述qos是彼此的函数。

5.如权利要求1所述的方法,进一步包括:通过将表示所述工作流的算法或数据集元数据中的至少一个的计算复杂度与和当前工作负载相当的历史工作负载相关联的计算复杂度进行比较,来确定与所述算法或所述数据集元数据中的所述至少一个相关联的所述计算复杂度,并且将所述确定的eq评级指定为和与所述相当的历史工作负载相关联的eq评级相当的eq评级。

6.如权利要求1所述的方法,其中,预测所述工作负载资源需求包括:在工作流的一个或多个阶段将付费qos值与历史或估计的工作负载资源使用相结合。

7.如权利要求1所述的方法,其中,预测所述工作负载资源需求包括:凭借静态qos来维护所述适用的eq评级,所述静态qos构成了通过调度所述一个或多个资源的使用而满足的所述适用的eq评级,所述一个或多个资源是基于贯穿工作流的一个或多个阶段的所述预测的工作负载资源需求来分配的。

8.如权利要求1所述的方法,其中,提供所述运行时持续的qos包括:在所述工作流的运行时期间跟踪平均qos,并且其中,动态地再分配所述一个或多个资源包括:在所述平均qos小于付费qos时提高所述运行时持续的qos。

9.如权利要求8所述的方法,其中,提供所述运行时持续的qos包括:在所述工作流的运行时期间跟踪所述平均qos,并且其中,动态地再分配所述一个或多个资源包括:在所述平均qos大于所述付费qos时降低所述运行时持续的qos。

10.如权利要求1所述的方法,其中,提供所述运行时持续的qos包括:在所述工作流的运行时期间跟踪平均qos,并且通过与所述计算系统的使用相关联的折扣计费来使所述平均qos与付费qos同步。

11.一种方法,包括...

【专利技术属性】
技术研发人员:K·利奇D·S·米洛伊契奇M·艾尔特
申请(专利权)人:慧与发展有限责任合伙企业
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1