The invention relates to the field of cloud computing, and discloses a flexible resource allocation method and system for streaming data load, which improves resource utilization in resource allocation based on real-time prediction of streaming data load. The method of the invention includes: acquiring historical streaming data as training set and dividing training set into three subsets; acquiring real-time streaming data to update three subsets separately. According to the three subsets, an online and dynamically updated SVR prediction model is obtained, and the flow data load is predicted by using the SVR prediction model; the throughput of the flow data system in cloud computing system is calculated, and the throughput threshold is set according to the throughput; the prediction results are compared with the load threshold, and when the flow data load prediction results are larger than the throughput threshold, the flow data system increases accordingly. The number of virtual machines; when the prediction result of stream data load is less than the throughput threshold, the stream data system reduces the number of virtual machines.
【技术实现步骤摘要】
一种流数据负载的弹性资源配置方法及系统
本专利技术涉及云计算领域,尤其涉及一种流数据负载的弹性资源配置方法及系统。
技术介绍
随着互联网、物联网及大数据技术的发展,流数据即无限、实时、动态的流形式数据越来越多地出现及应用在金融分析、社交媒体、传感器、网站踪、大规模科学实验等领域,流数据被快速分析才能获取到最大的价值。传统的数据管理系统无法实时处理此类无穷、实时、有序、大规模的流数据。云计算的按需供给服务通过管理、调度与整合分布在网络上的各种资源,以统一的界面为大量用户提供服务,用户则按需计量地使用这些服务。将计算、存储、软件等各种数据中心资源作为一种公用设施来提供,用户根据自己的需要使用,按照使用资源付费,给流处理系统资源弹性分配提供了技术支持。云计算弹性资源分配方法主要有水平调整、垂直调整和迁移三种方式。水平调整是从用户的虚拟机环境中添加或移除应用程序、容器或虚拟机,该方法是目前应用最广泛的弹性资源分配方法;垂直调整是为虚拟机等实例添加或删除CPU、内存等资源;迁移则将物理服务器上运行的虚拟机或应用程序转移至其他服务器中。弹性资源分配中触发弹性操作时机的方法可以分为主动式和反应式两类,主动式则是使用工作负载预测技术来确定未来工作负载何时会超过当前资源配置容量,并在容量超出前调用算法分配额外的资源;反应式不进行预测,通过监控负载变化,并利用资源利用率或服务等级协议(Service-LevelAgreement,简称SLA协议)违约的阈值来触发弹性分配。尽管云资源弹性调整已有多种技术的支持,但是弹性扩展需要较大的时间开销,对于处理实时突变的流数据负载来说效率 ...
【技术保护点】
1.一种流数据负载的弹性资源配置方法,其特征在于,包括以下步骤:S1:获取历史流数据作为训练集,并将所述训练集划分为三个子集,包括错误支持样本集、支持样本集、以及保留样本集;S2:获取实时流数据以分别同步更新所述三个子集,根据所述三个子集得到在线且动态更新的SVR预测模型,并采用所述SVR预测模型对流数据负载进行预测;S3:计算云计算系统中流数据系统的吞吐量,根据所述吞吐量设置吞吐量阈值;S4:将所述S2中的流数据负载预测结果与所述S3中的所述吞吐量阈值进行比较,当所述流数据负载预测结果大于所述吞吐量阈值时,流数据系统增加相应的虚拟机个数;当所述流数据负载预测结果小于所述吞吐量阈值时,所述流数据系统减少相应的虚拟机个数。
【技术特征摘要】
2018.09.07 CN 20181104581031.一种流数据负载的弹性资源配置方法,其特征在于,包括以下步骤:S1:获取历史流数据作为训练集,并将所述训练集划分为三个子集,包括错误支持样本集、支持样本集、以及保留样本集;S2:获取实时流数据以分别同步更新所述三个子集,根据所述三个子集得到在线且动态更新的SVR预测模型,并采用所述SVR预测模型对流数据负载进行预测;S3:计算云计算系统中流数据系统的吞吐量,根据所述吞吐量设置吞吐量阈值;S4:将所述S2中的流数据负载预测结果与所述S3中的所述吞吐量阈值进行比较,当所述流数据负载预测结果大于所述吞吐量阈值时,流数据系统增加相应的虚拟机个数;当所述流数据负载预测结果小于所述吞吐量阈值时,所述流数据系统减少相应的虚拟机个数。2.根据权利要求1所述的流数据负载的弹性资源配置方法,其特征在于,所述S2中根据所述三个子集得到在线且动态更新的SVR预测模型之前还包括步骤:同步更新三个子集后,删除保留样本集中的样本及对应的样本权重,然后更新错误支持样本集的样本权重和支持样本集的样本权重。3.根据权利要求1所述的流数据负载的弹性资源配置方法,其特征在于,所述S2中,采用所述SVR预测模型对流数据负载进行预测具体包括:S21:获取历史流数据作为所述SVR预测模型的输入,计算历史预测误差平均值;S22:采用所述SVR预测模型预测流...
【专利技术属性】
技术研发人员:胡志刚,康惠,郑美光,陶勇,
申请(专利权)人:中南大学,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。