计算引擎选择方法和基于该方法的多计算引擎平台技术

技术编号：19746338 阅读：25 留言：0更新日期：2018-12-12 04:55

本发明专利技术提供了一种计算引擎选择方法和基于该方法的多计算引擎平台。该方法包括：将待计算任务对应的任务特征数据输入到多个计算引擎中的每一个计算引擎的任务执行时间预测模型，获得待计算任务在每一个计算引擎上的任务执行时间预测结果，其中，所述任务执行时间预测模型是基于训练样本集通过训练获得，所述训练样本集包括多条任务特征数据和对应的任务执行时间；根据所述任务执行时间预测结果从所述多个计算引擎中选择执行待计算任务的计算引擎。本发明专利技术的方法能够自动选择效率高的计算引擎，降低了任务执行时间。

全部详细技术资料下载

【技术实现步骤摘要】
计算引擎选择方法和基于该方法的多计算引擎平台
本专利技术涉及信息
，尤其涉及一种计算引擎选择方法和基于该方法的多计算引擎平台。
技术介绍
随着国家在海、空、天、深海等方向大量新型装备的发展，装备试验变得愈发重要。例如，在歼10战斗机研制过程中，共进行了上万次的风洞试验，获得了百万条气动力数据，对这些数据的处理分析成为歼10成功研制的重要基础。装备试验包括“试验”与“评价”两个过程，是获取数据的一种途径，然后对各种数据进行分析、处理、比较，以帮助做出决策。目前仍然主要依靠专家经验与计算机辅助处理的试验数据处理方式，已经不能满足当前试验数据处理的需要，并且，由于在试验数据处理需要对规模不同的数据量进行处理，结构化与非结构化处理混杂，实时与离线处理相结合等情况，使用单一引擎已经无法应对各类试验处理需求。针对此问题，目前有三种解决思路：首先是人工管理多种引擎，将计算引擎分开部署，并采用人工方式管理计算引擎、执行计算任务，此方式需要大量人力，效率低下，同时若系统不保持全负载，就会造成巨大的资源浪费；第二种方式是使用支持各种计算需求的“超级”引擎，具体为部署一个支持所有处理方式的引擎，使用此引擎就可以满足所有的试验数据处理需求，但目前这种方式成熟度不高，距离大规模使用还需时日；第三种方式是前两者的折中，使用一个支持多计算引擎的计算平台，这种方式一方面能够应用目前成熟的各种计算引擎技术，另一方面使用自动化的方法对计算引擎和计算任务进行管理，能够提高资源利用率和任务执行效率。总之，对于上述三种方式，人工管理多种引擎效率低下，“超级”引擎一时难以满足急切需求，一个多计...

【技术保护点】
1.一种计算引擎选择方法，包括以下步骤：步骤1：将待计算任务对应的任务特征数据输入到多个计算引擎中的每一个计算引擎的任务执行时间预测模型，获得待计算任务在每一个计算引擎上的任务执行时间预测结果，其中，所述任务执行时间预测模型是基于训练样本集通过训练获得，所述训练样本集包括多条任务特征数据和对应的任务执行时间；步骤2：根据所述任务执行时间预测结果从所述多个计算引擎中选择执行待计算任务的计算引擎。

【技术特征摘要】
1.一种计算引擎选择方法，包括以下步骤：步骤1：将待计算任务对应的任务特征数据输入到多个计算引擎中的每一个计算引擎的任务执行时间预测模型，获得待计算任务在每一个计算引擎上的任务执行时间预测结果，其中，所述任务执行时间预测模型是基于训练样本集通过训练获得，所述训练样本集包括多条任务特征数据和对应的任务执行时间；步骤2：根据所述任务执行时间预测结果从所述多个计算引擎中选择执行待计算任务的计算引擎。2.根据权利要求1所述的方法，其中，所述任务特征数据包括算法类型、算法参数、数据类型、数据量和数据存放位置中的至少一项。3.根据权利要求1所述的方法，其中，通过以下步骤构建一个计算引擎的训练样本集：步骤31：收集多条用于描述任务信息的任务描述数据，；步骤32：利用该计算引擎执行每一条任务描述数据对应的任务，获得每一条任务描述数据对应的任务执行时间；步骤33：从每一条任务描述数据中提取影响任务执行时间的特征组成任务特征数据，结合所获得的任务执行时间构建该计算引擎的训练样本集。4.根据权利要求1所述的方法，其中，通过执行以下步骤获得一个计算引擎的任务执行时间预测模型：步骤41：基于该计算引擎的训练样本集，以任务特征数据为自变量，以任务执行时间为因变量，建立线性回归模型，表示为：yi＝β0+β1xi1+…+βpxip,i＝1,2,…,n其中，xi1至xip表示该计算引擎的训练样本集包含的任务特征，i表示该计算引擎的训练样本集中包含的样本数据条数的编号，n为该计算引擎的训练样本集的样本数据条数，β0为待优化偏置值，β1至βp为待优化权重值；步骤42：使用最小...

【专利技术属性】
技术研发人员：杜一凡，陈昭，刁博宇，徐勇军，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人