用于迁移工作负载的方法和机架系统技术方案

技术编号：18426057 阅读：50 留言：0更新日期：2018-07-12 01:55

提供了一种用于迁移工作负载的方法以及一种机架系统。所述用于迁移工作负载的方法包括：接收从机架系统的多个服务器节点中运行的多个应用程序生成的多个工作负载；监视所述多个工作负载的延迟要求并检测工作负载对所述延迟要求的违反；收集机架系统的系统利用率信息；计算将所述工作负载迁移至机架系统中的其他服务器节点的奖励；确定所述多个服务器节点中的使奖励最大化的目标服务器节点；执行所述工作负载到目标服务器节点的迁移。

Methods and rack systems for migrating work loads

A method for migrating workloads and a rack system are provided. The methods used to migrate a workload include receiving multiple workload generated by a plurality of applications running from a plurality of server nodes in the rack system; monitoring the delay requirements of the multiple workload and detecting the violation of the delay requirements of the workload; collecting the system utilization information of the rack system; Calculate the incentive to migrate the workload to the other server nodes in the rack system; determine the target server node that maximizes the reward in the multiple server nodes; perform the migration of the workload to the target server node.

全部详细技术资料下载

【技术实现步骤摘要】
用于迁移工作负载的方法和机架系统本申请要求于2016年12月30日提交的第62/441,027号美国临时专利申请以及于2017年3月23日提交的第15/467,458号美国专利申请的权益和优先权，这些专利申请的公开内容通过引用全部包含于此。
本公开总体涉及一种包括固态驱动器(SSD)的机架(rack)系统，更具体地，涉及一种用于提供减少高性能SSD的长尾延迟的机架级调度器的系统和方法。
技术介绍
高速非易失性存储器(NVMe)为主机软件定义了寄存器级接口以通过外围组件互连高速(PCIe)总线与非易失性存储器子系统(例如，SSD)通信。结构上NVMe(NVMeoverfabrics，NVMeoF)(或简称NVMf)定义了通过大范围的存储网络结构(诸如以太网、光纤信道、无限带宽和其他网络结构)支持NVMe块存储协议的通用架构。NVMeoF在底层结构上与针对传输控制协议(TCP)/互联网协议(IP)和远程直接存储器访问(RDMA)的不同网络堆栈兼容。以各种应用程序为目标的许多大规模服务(例如，基于云的服务)可以由数据中心内的多个服务器托管。这种服务通常需要交互，从而对响应时间敏感。因此，在当今的数据中心中，能够在提供高吞吐量的同时具有低数据访问延迟的高性能存储装置变得流行。具体地，基于NVMe的SSD和NVMeoF装置由于其高带宽、低延迟和优异的随机输入/输出(I/O)性能正变为数据中心所选择的存储。然而，这些高性能存储装置会由于诸如垃圾回收的后台任务而引起周期性延迟尖峰。另一方面，当运行在同一服务器上同地协作(co-located)的多个服务的应用程序在底层结...

【技术保护点】
1.一种用于迁移工作负载的方法，所述方法包括：接收从机架系统的多个服务器节点中运行的多个应用程序生成的多个工作负载；监视所述多个工作负载的延迟要求并检测工作负载对所述延迟要求的违反；收集机架系统的系统利用率信息；计算将所述工作负载迁移至机架系统中的其他服务器节点的奖励；确定所述多个服务器节点中的使奖励最大化的目标服务器节点；执行所述工作负载到目标服务器节点的迁移。

【技术特征摘要】
2016.12.30 US 62/441,027;2017.03.23 US 15/467,4581.一种用于迁移工作负载的方法，所述方法包括：接收从机架系统的多个服务器节点中运行的多个应用程序生成的多个工作负载；监视所述多个工作负载的延迟要求并检测工作负载对所述延迟要求的违反；收集机架系统的系统利用率信息；计算将所述工作负载迁移至机架系统中的其他服务器节点的奖励；确定所述多个服务器节点中的使奖励最大化的目标服务器节点；执行所述工作负载到目标服务器节点的迁移。2.如权利要求1所述的方法，所述方法还包括向主机操作系统提供包括迁移的状态的反馈。3.如权利要求1所述的方法，其中，机架系统包括多个存储装置。4.如权利要求1所述的方法，其中，机架系统兼容NVMeoF标准，所述多个存储装置可以是NVMeoF装置。5.如权利要求1所述的方法，其中，当所述工作负载的尾延迟比延迟阈值高时，检测到所述工作负载违反了所述延迟要求。6.如权利要求5所述的方法，其中，延迟阈值根据所述多个应用程序和/或所述多个工作负载的服务质量要求以及机架系统的系统利用率而动态地改变。7.如权利要求1所述的方法，其中，通过奖励函数来计算奖励，奖励函数是多个系统利用率参数的线性权重函数。8.如权利要求7所述的方法，其中，系统利用率参数包括可用CPU的数量、可用存储器的大小、可用网络带宽以及可用磁盘带宽中的一个或更多个。9.如权利要求1所述的方法，其中，所述方法还包括以循环的方式在所述多个服务器节点之间传递令牌，其中，在所述多个服务器节点中仅持有令牌的服务器节点确定迁移工作负载。10.一种机架系统，所述机架系统包括：多个服务器节点；多个存储装置，附属到机架系统；结构，在所述多个服务器节点和所述多个存储装置之间提供连接性；机架级调度器，包括尾延迟异常监视器以及目标发现单元，其中，尾延迟异常监视器...

【专利技术属性】
技术研发人员：徐秋旻，克里希纳·T·马拉丁，马努·阿瓦施，
申请(专利权)人：三星电子株式会社，
类型：发明
国别省市：韩国,KR

全部详细技术资料下载我是这个专利的主人