一种数据的动态加载处理方法及系统技术方案

技术编号：10356801 阅读：85 留言：0更新日期：2014-08-27 13:02

本发明专利技术提供一种数据的动态加载处理方法及系统，所述方法包括：获取当前系统的待加载的原子任务；根据所述的原子任务生成组合任务；动态采集当前系统的即时中央处理器CPU使用率、即时输入/输出IO使用率；根据所述的即时CPU使用率、即时IO使用率加载所述的组合任务。通过将原ETL任务中的源表——目标表关系视为一个原子任务，对其进行动态组合，使得ETL任务具备较高的灵活性，实现原子任务较高层次的复用度，动态组合任务加载，做到系统资源得以充分的利用，最大程度地优化提升数据仓库对外提供服务质量。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据的动态加载处理方法及系统
本专利技术关于计算机数据
，特别是关于计算机数据的抽取、转换、装载技术，具体的讲是一种数据的动态加载处理方法及系统。
技术介绍
数据仓库是一个庞大的数据海洋，海量的数据都是通过ETL(ExtractTransformLoad、数据抽取、转换、装载)任务来完成加载转换的。随着计算机技术的日益发展，数据仓库的规模不断壮大，纳入的数据源与日俱增，其时效性也参差不齐。现有技术中的ETL任务，是将进相同数据仓库模型实体的不同源表全部组合在同一个加载任务中，仅当该任务的所有上游源表到齐后，才开始加载转换。因此，通过现有技术中的ETL任务来完成加载转换存在如下问题：1、加载任务若集中在一段时间内爆发，爆发前上游数据到达却不加载，会导致系统空闲；爆发后若系统繁忙压力较大，会导致加载速度受限于系统资源。2、涉及批量中关键路径上的作业，只能通过固定拆分任务实现调整，不够自动、灵活。因此，如何提出一种基于数据的动态加载处理的方案，其能够克服数据仓库ETL任务内容固定组合所带来的不利影响是本领域亟待解决的技术难题。
技术实现思路
为了克服现有技术存在的数据仓库ETL任务内容固定组合所带来的不利影响的技术问题，本专利技术提供了一种数据的动态加载处理方法及系统，将原ETL任务中的源表——目标表关系视为一个原子任务，对其进行动态组合，实现较优原子组合，以充分利用系统资源，提高ETL效率，提高数据仓库对外数据服务效益。本专利技术的目的之一是，提供一种数据的动态加载处理方法，包括：获取当前系统的待加载的原子任务；根据所述的原子任务生成组合任务；动态采集当...
一种数据的动态加载处理方法及系统

【技术保护点】
一种数据的动态加载处理方法，其特征是，所述的方法具体包括：获取当前系统的待加载的原子任务；根据所述的原子任务生成组合任务；动态采集当前系统的即时中央处理器CPU使用率、即时输入/输出IO使用率；根据所述的即时CPU使用率、即时IO使用率加载所述的组合任务。

【技术特征摘要】
1.一种数据的动态加载处理方法，其特征是，所述的方法具体包括：获取当前系统的待加载的原子任务；根据所述的原子任务生成组合任务；动态采集当前系统的即时中央处理器CPU使用率、即时输入/输出IO使用率；根据所述的即时CPU使用率、即时IO使用率加载所述的组合任务，该步骤包括：获取当前系统的CPU使用上限以及IO使用上限；根据所述的即时CPU使用率、当前系统的CPU使用上限判断所述的即时CPU使用率是否饱和；当判断为否时，根据所述的即时IO使用率、当前系统的IO使用上限继续判断所述的即时IO使用率是否饱和；当判断为否时，确定所述组合任务的加载所需资源；其中，确定所述组合任务的加载所需资源包括：获取所述原子任务的原子生成记录、运行时间以及数据规模；根据所述的运行时间以及数据规模确定原子数据加载效率；根据所述的原子数据加载效率以及原子生成记录确定所述组合任务的加载完成时间；获取所述原子任务的到达时间区间；当所述组合任务的加载完成时间在所述的到达时间区间内时，获取所述原子任务的资源消耗；根据所述的资源消耗以及原子生成记录确定所述组合任务的加载所需资源。2.根据权利要求1所述的方法，其特征是，根据所述的原子任务生成组合任务具体包括：确定所述原子任务的目标表；确定所述原子任务的源表；根据所述原子任务的源表以及目标表对所述的原子任务进行组合，生成组合任务。3.根据权利要求2所述的方法，其特征是，根据所述的即时CPU使用率、即时IO使用率加载所述的组合任务还包括：根据所述的加载所需资源、所述的CPU使用上限以及IO使用上限加载所述的组合任务。4.根据权利要求3所述的方法，其特征是，根据所述的加载所需资源、所述的CPU使用上限以及IO使用上限加载所述的组合任务具体包括：根据所述加载所需资源确定所述组合任务加载所需的CPU使用率以及IO使用率；判断所述组合任务加载所需的CPU使用率是否超出当前系统的CPU使用上限；当判断为否时，继续判断所述组合任务加载所需的IO使用率是否超出当前系统的IO使用上限；当判断为否时，加载所述的组合任务。5.根据权利要求2所述的方法，其特征是，根据所述的即时CPU使用率、即时IO使用率加载所述的组合任务还包括：当所述的即时IO使用率饱和时，获取所述原子任务的运行时间、资源消耗；根据所述的运行时间、资源消耗确定所述原子任务的属性偏向；根据所述原子任务的属性偏向确定所述组合任务的属性偏向；判断所述组合任务的属性偏向是否为CPU型；当判断为是时，加载所述的组合任务。6.根据权利要求2所述的方法，其特征是，根据所述的即时CPU使用率、即时IO使用率加载所述的组合任务还包括：当所述的即时CPU使用率饱和时，根据所述的即时IO使用率、当前系统的IO使用上限继续判断所述的即时IO使用率是否饱和；当判断为否时，获取所述原子任务的运行时间、资源消耗；根据所述的运行时间、资源消耗确定所述原子任务的属性偏向；根据所述原子任务的属性偏向确定所述组合任务的属性偏向；判断所述组合任务的属性偏向是否为IO型；当判断为是时，加载所述的组合任务。7.一种数据的动态加载处理系统，其特征是，所述的系统具体包括：原子任务获取装置，用于获取当前系统的待加载的原子任务；组合任务生成装置，用于根据所述的原子任务生成组合任务；即时使用率采集装置，用于动态采集当前系统的即时中央处理器CPU使用率、即时输入/输出IO使用率...

【专利技术属性】
技术研发人员：江军华，黄兆斌，李卓辉，徐炜，
申请(专利权)人：中国工商银行股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人