计划优化方法、装置、系统及计算机可读存储介质制造方法及图纸

技术编号：21714377 阅读：20 留言：0更新日期：2019-07-27 19:12

本发明专利技术提供了一种计划优化方法、装置、系统及计算机可读存储介质，涉及大数据技术领域，该方法包括：根据预设的计划查询节点对本地计划的状态进行查询；当查询到准备执行本地计划时，基于本地计划中预设的分区参数确定按照自适应优化规则在分区中执行本地计划；其中，自适应优化规则为基于可配置的数据处理门限和计划执行过程中的元数据对计划进行重新分区的规则；基于自适应优化规则，采集本地计划在各分区执行过程中的元数据，根据采集到的元数据和数据处理门限对本地计划的执行分区进行优化。本发明专利技术可以实现对计划的动态调整，改善各分区处理数据倾斜的问题，从而提高集群资源利用率和SQL的运行性能。

Planning optimization methods, devices, systems and computer-readable storage media

全部详细技术资料下载

【技术实现步骤摘要】
计划优化方法、装置、系统及计算机可读存储介质
本专利技术涉及大数据
，尤其是涉及一种计划优化方法、装置、系统及计算机可读存储介质。
技术介绍
在现有的大数据生态环境中，Spark(计算引擎)是使用最为广泛的计算组件，但是在超大规模集群和数据集上，SparkSQL(SparkStructuredQueryLanguage，计算引擎结构化查询语言)仍然存在很多问题，比如：无法提前合理的分配分区个数，SQL任务的执行计划确定后不可改变，以及SQL任务在执行过程中，某一个分区可能存在数据倾斜问题。目前还不能较好的解决以上问题，导致集群资源利用率、SQL任务的运行性能较差。
技术实现思路
本专利技术的目的在于提供计划优化方法、装置、系统及计算机可读存储介质，以实现对计划的动态调整，改善各分区处理数据倾斜的问题，从而提高集群资源利用率和SQL的运行性能。本专利技术提供的计划优化方法，包括：根据预设的计划查询节点对本地计划的状态进行查询；当查询到准备执行所述本地计划时，基于本地计划中预设的分区参数确定按照自适应优化规则在分区中执行所述本地计划；其中，所述自适应优化规则为基于可配置的数据处理门限和计划执行过程中产生的元数据而对计划进行重新分区的规则；基于所述自适应优化规则，采集所述本地计划在各分区执行过程中的元数据，根据采集到的所述元数据和数据处理门限对所述本地计划的执行分区进行优化。进一步的，所述根据预设的计划查询节点对本地计划的状态进行查询的步骤，包括：根据本地计划，创建数据聚合过程中查询节点的输入和spark广播的输入；基于所述查询节点的输入编写状态查询节点，基于...

【技术保护点】
1.一种计划优化方法，其特征在于，包括：根据预设的计划查询节点对本地计划的状态进行查询；当查询到准备执行所述本地计划时，基于本地计划中预设的分区参数确定按照自适应优化规则在分区中执行所述本地计划；其中，所述自适应优化规则为基于可配置的数据处理门限和计划执行过程中产生的元数据而对计划进行重新分区的规则；基于所述自适应优化规则，采集所述本地计划在各分区执行过程中的元数据，根据采集到的所述元数据和数据处理门限对所述本地计划的执行分区进行优化。

【技术特征摘要】
1.一种计划优化方法，其特征在于，包括：根据预设的计划查询节点对本地计划的状态进行查询；当查询到准备执行所述本地计划时，基于本地计划中预设的分区参数确定按照自适应优化规则在分区中执行所述本地计划；其中，所述自适应优化规则为基于可配置的数据处理门限和计划执行过程中产生的元数据而对计划进行重新分区的规则；基于所述自适应优化规则，采集所述本地计划在各分区执行过程中的元数据，根据采集到的所述元数据和数据处理门限对所述本地计划的执行分区进行优化。2.根据权利要求1所述的方法，其特征在于，所述根据预设的计划查询节点对本地计划的状态进行查询的步骤，包括：根据本地计划，创建数据聚合过程中查询节点的输入和spark广播的输入；基于所述查询节点的输入编写状态查询节点，基于所述spark广播的输入编写状态广播节点；根据所述状态查询节点对所述本地计划的状态进行查询，并将查询到的状态通过所述状态广播节点进行广播。3.根据权利要求1所述的方法，其特征在于，所述基于本地计划中预设的分区参数确定按照自适应优化规则在分区中执行所述本地计划的步骤，包括：判断所述本地计划中预设的分区参数是否为启用自适应状态；如果是，按照自适应优化规则在分区中执行所述本地计划。4.根据权利要求3所述的方法，其特征在于，所述判断所述本地计划中预设的分区参数是否为启用自适应状态的步骤，包括：当判断所述本地计划中预设的分区参数为默认状态时，按照原生spark优化规则在分区中执行所述本地计划；其中，所述原生spark优化规则为基于不可配置的已有数据处理门限和计划执行过程中产生的元数据而对计划进行重新分区的规则。5.根据权利要求1所述的方法，其特征在于，所述数据处理门限包括数据处理条数门限和数据处理空间门限，所述方法包括：根据预先定义的数据条数的配置参数配置各分区的所述数据处理条...

【专利技术属性】
技术研发人员：张永飞，侯良伟，杨尧，王诗强，
申请(专利权)人：成都四方伟业软件股份有限公司，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人