【技术实现步骤摘要】
一种ETL执行模板的生成方法
[0001]本公开涉及
ETL
任务执行
,尤其涉及一种
ETL
执行模板的生成方法
、
系统和电子设备
。
技术介绍
[0002]如附图1所示的
ETL
任务执行示意图,主要是指在
ETL
模块的
JobEngine
任务工厂中进行任务执行,
ETL
任务执行,主要是对用户输入的算子图进行解析操作,生成对应的任务引擎通用脚本,以便在任务引擎中执行
。ETL
执行上下文工厂产生
ETL
执行上下文,基于
BaseETLContext
提供一些基础性的上下文的算子操作方法
。
[0003]ETL
执行上下文兼具两个功能:
[0004]一个是将参数转换为
DataFlow
和
BaseCommand
拓扑排序;
[0005]另一个是隔离其他域
。
使
ETL
不与其他域直接接触,防止两者直接耦合
。
[0006]因此
ETL
执行上下文相当于一个外观模式,目的是隐藏外部调用的复杂性,提供了
ETL
域与其他域交互的委托调用
。
[0007]而
ETL
任务,主要包含
ETL
任务执行流程以及对应的
ETL
任 ...
【技术保护点】
【技术特征摘要】
1.
一种
ETL
执行模板的生成方法,其特征在于,包括如下步骤:通过
ETL
执行上下文工厂
‑
ETL Execution Context Factory
生成
ETL
执行上下文
‑
ETL Execution Contextx
;解析所述
ETL
执行上下文
‑
ETL Execution Contextx
,得到所述
ETL
执行上下文中的执行逻辑:算子依赖
、
生命周期和基本属性;将所述执行逻辑发送至预览工厂
‑
ET LPreview Factory
;由所述预览工厂
‑
ET LPreview Factory
根据所述执行逻辑,生成业务逻辑与所述
ETL
执行上下文所对应的
ETL
业务执行模板
‑
Abstract ETL Business Template。2.
根据权利要求1所述的
ETL
执行模板的生成方法,其特征在于,所述算子依赖,包括:支撑算子解析的相关封装逻辑;算子解析中需要使用到外部的表达式构建;算子依赖中会对算子解析需要使用的复杂函数进行封装,以便算子解析使用
。3.
根据权利要求1所述的
ETL
执行模板的生成方法,其特征在于,所述生命周期,包括:
ETL
执行过程中需要创建
/
更新数据集;获取输入
/
输出数据集;检查输出数据集;继承数据集;运行完成通知;检查输入数据集是否可用
。4.
根据权利要求1所述的一种
ETL
执行模板的生成方法,其特征在于,所述基本属性,包括:提供本次
ETL
运行时需要的基本属性,包括算子网
、
版本
、
拆分节点信息
、
域
、
所有者
、
优先级设置
、
附加任务参数和触发路径
。5.
根据权利要求1所述的
ETL
执行模板的生成方法,其特征在于,由所述预览工厂
‑
ET LPreview Factory
根据所述执行逻辑,生成业务逻辑与所述
ETL
执行上下文所对应的
ETL
业务执行模板
‑
Abstract ETL Business Template
,包括:所述预览工厂
‑
ET LPreview Factory
根据所述
ETL
执行上下文中的执行逻辑:算子依赖
、
生命周期和基本属性,构建如下模板内容:
(1)、
产生执行任务模块
‑
spawn
,用于:产生一个
ETL
执行任务并提交任务管理执行;
(2)、
构建返回信息模块
‑
build Response
,用于:构建返回信息,包含任务
ID、
报错信息,以及前端进行展示;
(3)、
任务执行前置检查模块
‑
before Execute Task
,用于
(3.1)、
...
【专利技术属性】
技术研发人员:周远,戴舒原,吴宝琪,张怡,
申请(专利权)人:杭州观远数据有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。