用于实时数据ETL系统的记忆式调度方法技术方案

技术编号:3791019 阅读:610 留言:0更新日期:2012-04-11 18:40
用于实时数据ETL系统的记忆式调度方法,ETL调度主程序按照预先设定的顺序执行某个任务,执行的时候把lscycle最近成功数据周期、curcycle当前处理数据周期、endcycle处理截止数据周期等由调度引擎记忆下来的关键信息传给被调程序,被调程序执行完成之后,由调度引擎记录并保存更新后的调度信息;在数据重抽中,通过记忆式调度方法自动对其中的某些任务和某些周期进行自动重抽;记忆式调度方法(有状态调度方法)解决了传统ETL调度程序无状态的特点,简化了被调程序的任务,通过记忆状态使得被调程序可以专注于自己的业务逻辑,为实时数据ETL领域赢得了大量的开发时间,大大提高了项目实施的效率。

【技术实现步骤摘要】

本技术专利技术方案应用于实时数据ETL系统的调度,采用记忆式调度方法(有状态调 度方法)用于解决实时数据ETL系统中被调程序疲于处理调度信息的问题,从而使得被 调程序可以专注于自身的业务逻辑。二
技术介绍
ETL (Extraction—Transformation-Loading)即数据抽取、转换和力n载。ETL负责 将分布的、异构数据源中的数据,如关系数据、平面数据文件等抽取到临时中间层后进 行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析的数据。目前现 有的ETL调度方法都是非记忆、无状态的调度方法,如采用固定时间点进行调度(固定 周期),比如每天晚上23:00执行某个程序,两次调度之间在调度层面没有任何关联,任 务状态的判断和时间周期的选择完全由被调程序的程序逻辑自行完成,这样既增加了被 调程序的负担,又无法使被调程序专注于自己的业务逻辑。现有ETL调度方法的特点如下>周期闭环抽取问题目前的ETL调度方法都是非记忆和无状态的,只能解决固定 时间点(固定周期)的ETL抽取问题,时无法解决ETL系统中的时间戳抽取(周 期闭环)问题。>数据重抽问题目前本文档来自技高网...

【技术保护点】
用于实时数据ETL系统的记忆式调度方法,其特征是: ETL调度主程序按照预先设定的顺序执行某个任务,执行的时候把lscycle最近成功数据周期、curcycle当前处理数据周期、endcycle处理截止数据周期等由调度引擎记忆下来的关 键信息传给被调程序,被调程序执行完成之后,由调度引擎记录并保存更新后的调度信息;在数据重抽中,通过记忆式调度方法自动对其中的某些任务和某些周期进行自动重抽; *ETL数据分类: 根据ETL数据的变化特点,分成固定周期数据和周期闭 环数据: *固定周期:是指在分析周期内数据是静止的数据; *周期闭环:指抽取特定周期内数据是变化的、取...

【技术特征摘要】

【专利技术属性】
技术研发人员:常维余志刚刘国祥卞国震张峰刘树权沈鹏程兰清
申请(专利权)人:南京联创科技股份有限公司
类型:发明
国别省市:84[中国|南京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1