一种大数据分析任务的高效云配置选择算法制造技术

技术编号：21691110 阅读：36 留言：0更新日期：2019-07-24 16:05

本发明专利技术提出了一种大数据分析任务的高效云配置选择算法，通过选取部分输入数据进行小规模集群实验，进而构建性能预测模型，利用性能预测模型预估任务在大规模集群上的性能表现，并且通过性能预测结果来确定最佳的云配置。通过使用上述算法，能够用更低的模型训练时间和成本来有效地帮助用户找到最佳的云配置。为部署在云计算平台上的大规模数据分析任务选择最佳的云配置，可以显著提高其运行效率，并且降低运行成本。

An Efficient Cloud Configuration Selection Algorithm for Large Data Analysis Tasks

全部详细技术资料下载

【技术实现步骤摘要】
一种大数据分析任务的高效云配置选择算法
本专利技术属于云计算领域，尤其涉及基于大数据分析任务的高效云配置算法。
技术介绍
大规模数据分析任务日益增长，涉及的任务内容也日益复杂，其中经常涉及机器学习、自然语言处理和图像处理等方面。与传统计算任务相比，此类任务通常是数据密集型和计算密集型的，需要更长的计算时间和更高的计算成本。因此为了完成大规模数据分析任务，通常利用云计算巨大的计算能力来帮助完成任务。为大规模分析任务选择最佳的云配置，能够提高任务的运行效率，并且能降低用户的计算成本。为了满足不同的计算要求，现有的云服务提供商为用户提供上百种具有不同资源配置的实例类型(如亚马逊的EC2、微软的Azure和谷歌的ComputeEngine)。虽然大多数云服务提供商只允许用户从可用实例类型池中进行选择实例类型，但Google的ComputeEngine允许用户自定义配置虚拟机(配置vCPU和内存)，这也使得选择正确的云配置变得更具挑战性。除此之外，各大云服务提供商也提供了Serverless云架构(例如亚马逊Lambda，谷歌CloudFunctions和微软AzureFunctions)，这项服务允许用户将任务作为Serverless功能运行，而无需使用预先指定的配置启动实例。但是，Serverless架构可能需要应用程序重构其代码，而且Serverless云提供商并不能够帮助用户将任务完成时间最小化，或者帮助用户降低计算成本。云配置的选择，即实例的类型和实例数量的选择，直接影响任务的完成时间和耗费的经济成本。正确选择的云配置可以以更低的成本实现相同的性能目标。由...

【技术保护点】
1.大数据分析任务的高效云配置选择算法，其特征在于，包含以下步骤：步骤1：训练数据收集：选取多个一定比例的输入数据和该比例对应的任务执行时所使用的云服务器实例个数，确定每组试验参数和任务完成时间，其中，所述一定比例指实验使用数据占输入数据的比例；步骤2：模型构造：利用步骤1中的试验参数和任务完成时间，以所述的输入数据比例和实例个数，设计涉及输入数据比例和实例个数的拟合多项式，确定基础预测模型

【技术特征摘要】
1.大数据分析任务的高效云配置选择算法，其特征在于，包含以下步骤：步骤1：训练数据收集：选取多个一定比例的输入数据和该比例对应的任务执行时所使用的云服务器实例个数，确定每组试验参数和任务完成时间，其中，所述一定比例指实验使用数据占输入数据的比例；步骤2：模型构造：利用步骤1中的试验参数和任务完成时间，以所述的输入数据比例和实例个数，设计涉及输入数据比例和实例个数的拟合多项式，确定基础预测模型中wk的值。其中βk表示是否选择了拟合项fk(βk＝1表示选择该项)；模型转换：将步骤1中耗时最少的试验参数在目标实例类型下获得运行时间为ttarget，利用映射的方式，目标实例类型的预测模型导出为其中步骤3：选择器构造：对于任务的给定输入数据集，利用步骤2得到的预测模型，计算满足特定运行时间和成本约束的最优选云配置。2.根据权利要求1所述的大数据分析任务的高效云配置选择算法，其特征在于：所述步骤1中选取多个一定比例的输入数据和该比例对应的任务执行时所使用的云服务器实例个数具体过程为：先选取一定比例范围的输入数据和一定范围的云服务器实例个数，根据D-optimality，在实...

【专利技术属性】
技术研发人员：陈艳姣，林龙，
申请(专利权)人：武汉大学，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人