【技术实现步骤摘要】
—种纠错重启以及自动判断启动的ETL调度系统及方法
本专利技术属于数据仓库
,特别是一种纠错重启以及自动判断启动的ETL调 度系统及方法。
技术介绍
随着数据仓库技术的普及和深化,构建数据仓库的核心技术ETL工具也逐步地完 善且多样化,ETL在数据仓库构建中主要承担着数据抽取、加载、转换的角色,并负责系统程 序调度控制和资源分配,直接关系着数据仓库构建实施的成败。目前信息价值日益体现,尤其是具有大量数据记录的行业。成功的数据仓库对企 业的发展十分重要,银行、移动电信、保险、电子商务运营商的大数据特性决定了这些行业 极为注重数据仓库的构建及技术实施策略。目前的实施策略大体可以概括如下1、根据任务依赖关系设定调度顺序,依次完成系统调度任务;在调度过程中有管理人 员人工监控,出现异常进行人工操作重启任务。2、在依赖关系设定调度顺序的基础上,根据各独立任务的关系设定独立线程定时 定点调度,并进行任务监控、人工排错及重启调度。以上情况,都存在完全依赖人工处理的问题,而且还存在由于异常发生不能被及 时处理而使系统继续运行产生错误结果的情况,并导致系统资源的浪费。专利“一种ETL调度的实现方法及装置”(专利申请号200910203276. 9),在执行 ETL调度包含的若干任务流程时,针对任意一个任务流程,根据预设的配置文件确定任务流 程内包含的各子任务流程的触发方式、执行顺序和相互之间的依赖关系,按照设定的触发 方式触发子任务流程,并按设定的顺序执行已触发的子任务流程,并根据子任务流程之间 的依赖关系,执行依赖已完成子任务并已触发的后续子任务流程。专利“一种实现 ...
【技术保护点】
一种纠错重启以及自动判断启动的ETL调度系统,其特征在于,包括业务系统数据库服务器、数据仓库服务器、ETL调度监控服务器、ETL调度平台服务器;数据仓库服务器包括任务配置存储器、数据仓库数据存储器、ETL任务处理器、执行记录存储器,ETL任务处理器与数据仓库数据存储器和执行记录存储器相连;ETL调度监控服务器包括任务执行监控处理器、任务异常信息存储器、异常信息发送器,任务异常信息存储器与任务执行监控处理器和异常信息发送器相连;ETL调度平台服务器包括启动判断处理器、任务启动处理器,启动判断处理器与任务启动处理器相连;其中,数据仓库服务器的ETL任务处理器与业务系统数据库服务器和ETL调度平台服务器的任务启动处理器相连,ETL调度平台服务器的启动判断处理器分别与数据仓库服务器的任务配置存储器、执行记录存储器、以及ETL调度监控服务器的异常信息发送器相连,数据仓库服务器的执行记录存储器与ETL调度监控服务器的任务执行监控处理器相连。
【技术特征摘要】
1.一种纠错重启以及自动判断启动的ETL调度系统,其特征在于,包括业务系统数据库服务器、数据仓库服务器、ETL调度监控服务器、ETL调度平台服务器;数据仓库服务器包括任务配置存储器、数据仓库数据存储器、ETL任务处理器、执行记录存储器,ETL任务处理器与数据仓库数据存储器和执行记录存储器相连;ETL调度监控服务器包括任务执行监控处理器、任务异常信息存储器、异常信息发送器,任务异常信息存储器与任务执行监控处理器和异常信息发送器相连;ETL调度平台服务器包括启动判断处理器、任务启动处理器,启动判断处理器与任务启动处理器相连;其中,数据仓库服务器的ETL任务处理器与业务系统数据库服务器和ETL调度平台服务器的任务启动处理器相连,ETL调度平台服务器的启动判断处理器分别与数据仓库服务器的任务配置存储器、执行记录存储器、以及ETL调度监控服务器的异常信息发送器相连,数据仓库服务器的执行记录存储器与ETL调度监控服务器的任务执行监控处理器相连。2.根据权利要求1所述的一种纠错重启以及自动判断启动的ETL调度系统,其特征在于,所述的启动判断处理器包括任务配置信息抽取单元、配置信息处理单元、任务执行信息抽取单元、任务执行标志计算单元、任务标志发送单元,其中配置信息处理单元与任务配置信息抽取单元、任务执行信息抽取单元、任务执行标志计算单元相连,任务执行标志计算单元分别与配置信息处理单元、任务执行信息抽取单元、任务标志发送单元相连。3.一种纠错重启以及自动判断启动的ETL调度方法,其特征在于,包括以下步骤 步骤一安排任务、子任务的执行顺序,配置子任务之间的关联关系,把任务执行的先后顺序,任务包含的子任务,子任务执行的先后顺序,子任务之间的关系保存在数据仓库服务器的任务配置存储器中,且每个子任务对应数据仓库中的一张表,根据业务需要来安排任务在执行时间上的先后顺序,安排任务所包含的子任务的执行顺序时,子任务采用以下原则进行排序 (O当一个子任务与其它子任务之间具有关联关系时,必须在一个或者若干个前置子任务成功执行之后才能执行该子任务; (2)在此基础上,按照子任务的重要程度进行排序,对业务影响较大的子任务优先执行; (3)最后根据子任务执行的时间长度进行排序,执行时间较短的子任务优先执行; 步骤二 由启动判断处理器从任务配置存储器读取待执行子任务及其前置子任务信息;由启动判断处理器从执行记录存储器中读取待执行子任务及其前置子任务最近一次成功执行的结束时间;根据这些信息,通过启动判断处理器的计算,得出待执行子任务的执行标志,待执行子任务执行标志生成流程如下 (1)通过任务配置信息抽取单元,从任务配置存储器获取任务配置信息,通过配置信息处理单元获取当前待执行的子任务及其前置子任务的信息,将这些信息发送到任务执行标志计算单元; (2)任务执行信息抽取单元通过配置信息处理单元获取当前待执行的子任务及其前置子任务的信息,再从执行记录存储器获取当前待执行的子任务及其前置子任务最近一次成功执行的结束时间; 若最近一次成功执行的结束时间不存在,则表明当前子任务是第一次执行,直接得出“可执行”标志;(3)任务执行标志计算单元计算出待执行子任务所对应的所有前置子任务中最近一次成功执行的结束时间中的最早值,将这个最早值与待执行子任务的最后一次成功执行结束时间进行对比,对比方法如下 这个最早值若晚于待执行子任务的最后一次成功执行结束时间,则表明待执行子任务可以执行,返回“可执行”标志; 这个最早值若早于待执行子任务的最后一次成功执行结束时间,则表明待执行子任务的前置子任务中存在着执行异常的情况,返回“不可执行”标志; 步骤三将启动判断处理器中任务标志发送单元的执行标志结果发送到任务启动处理器;任务启动处理器分以下两种情况 若任...
【专利技术属性】
技术研发人员:何昌桃,黄建鹏,徐晓冬,陈静,
申请(专利权)人:焦点科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。