一种数据表生成方法及设备技术

技术编号:14874818 阅读:39 留言:0更新日期:2017-03-23 22:33
本申请公开了一种数据表生成方法。首先根据增量表的结构元数据信息以及预设的任务模板生成当前的数据表任务,在根据任务模板对数据表任务的调度信息进行配置之后,即可根据数据表任务以及调度信息执行建表语句以及初始化脚本,从而能够快速准确地的完成数据表的建设,减少人力消耗以及提高数据仓库建设效率。

【技术实现步骤摘要】

本申请涉及通信
,特别涉及一种数据表生成方法。本申请同时还涉及一种数据表生成设备。
技术介绍
数据仓库(DataWarehouse,又称为DW或DWH)是为企业所有级别的决策制定过程提供所有类型数据支持的战略集合。数据仓库是一个提供用户用于决策支持的当前和历史数据的环境,这些数据在传统的操作型数据库中很难或不能得到。数据仓库技术是为了有效的把操作形数据集成到统一的环境中以提供决策型数据访问的各种技术和模块的总称,其最终的目的是为了让用户更快更方便查询所需要的信息,以及提供决策支持。基础层(又称为ODS层)是数仓建设过程中将从业务系统库抽取过来的数据建立的一层贴源的数据层,从而方便后续数据整合。在目前的数据仓库建设过程中,ODS层与表相关的建设是基础层建设的重要组成部分,需要将通过同步中心引入的增量数据合并为一份全量数据,从而为后续的保留历史、数据整合、数据分析、数据应用等功能提供支持。目前,建立基础层相关的表需要在生产建表语句之后编写脚本以及配置调度信息,之后才能将脚本以及任务发布并执行。专利技术人在实现本申请的过程中发现,现有的任务脚本种类以及数量繁多,技术人员在采用脚本时非常容易遗漏或出错;而且现有的数据表生成都是非常基础且需要人工完成的工作,不仅消耗开发资源大,而且人工开发效率比较低下。由此可见,如何结合现有的数据仓库建设过程自动生成与ODS层所关联的表,从而减少人力消耗以及提高数据仓库建设效率,成为本领域技术人员亟待解决的技术问题。
技术实现思路
本申请提供了一种数据表生成方法,用以针对现有的数据库高效准确地建立基础层的数据表,从而减少人力消耗以及提高数据仓库建设效率。该方法包括:根据增量表的结构元数据信息以及预设的任务模板生成当前的数据表任务;根据所述任务模板对所述数据表任务的调度信息进行配置;根据所述数据表任务以及所述调度信息执行建表语句以及初始化脚本,以生成数据表。相应地,本申请还提出了一种数据表生成设备,包括:生成模块,用于根据增量表的结构元数据信息以及预设的任务模板生成当前的数据表任务;配置模块,用于根据所述任务模板对所述数据表任务的调度信息进行配置;执行模块,用于根据所述数据表任务以及所述调度信息执行建表语句以及初始化脚本,以生成数据表。通过应用本申请的技术方案,首先根据增量表的结构元数据信息以及预设的任务模板生成当前的数据表任务,在根据任务模板对数据表任务的调度信息进行配置之后,即可根据数据表任务以及调度信息执行建表语句以及初始化脚本,从而能够快速准确地的完成数据表的生成工作,从而减少人力消耗以及提高数据仓库建设效率。附图说明图1为本申请提出的一种数据表生成方法的流程示意图;图2为本申请具体实施例提出的一种数据表生成方法的流程示意图;图3为本申请提出的一种数据表生成设备的结构示意图。具体实施方式为便于对本申请的技术方案进行清除的阐述,在介绍本申请的技术方案之前,首先针对目前数据仓库中的一些内容进行介绍:(1)表表是数据仓库最重要的组成部分。一个表记录由key,度量,属性数据组成(例如员工表由员工号(key),员工姓名,年龄等等员工属性数据组成)。在本申请的技术方案中,数据仓库的建设存在以下两种类型的表:增量表:为了提高性能,对于大数据量表根据记录变更时间戳字段(一般是gmt_modify)采用增量同步,增量表每个快照保留一份增量数据,表命名方式为tablename_{yyyymmdd本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/55/201510587686.html" title="一种数据表生成方法及设备原文来自X技术">数据表生成方法及设备</a>

【技术保护点】
一种数据表生成方法,其特征在于,包括:根据增量表的结构元数据信息以及预设的任务模板生成当前的数据表任务;根据所述任务模板对所述数据表任务的调度信息进行配置;根据所述数据表任务以及所述调度信息执行建表语句以及初始化脚本,以生成数据表。

【技术特征摘要】
1.一种数据表生成方法,其特征在于,包括:根据增量表的结构元数据信息以及预设的任务模板生成当前的数据表任务;根据所述任务模板对所述数据表任务的调度信息进行配置;根据所述数据表任务以及所述调度信息执行建表语句以及初始化脚本,以生成数据表。2.如权利要求1所述的方法,其特征在于,所述数据表具体为基础层全量表,在根据增量表的结构元数据信息以及预设的任务模板生成当前的数据表任务之前,还包括:根据所述结构元数据信息生成与所述数据表对应的建表语句以及所述数据初始化脚本。3.如权利要求2所述的方法,其特征在于,在根据所述结构元数据信息生成与所述数据表对应的建表语句以及所述数据初始化脚本之前,还包括:将所述增量表同步至数据仓库,并获取所述增量表的所述结构元数据信息。4.如权利要求1所述的方法,其特征在于,所述任务模板具体为merge任务模板,根据增量表的结构元数据信息以及预设的任务模板生成当前的数据表任务,具体为:根据增量表结构元数据信息和批量merge任务模板成merge任务代码;将所述merge任务代码作为所述数据表任务上传至预设的代码库。5.如权利要求4所述的方法,其特征在于,根据所述任务模板对所述数据表任务的调度信息进行配置,具体为:根据所述...

【专利技术属性】
技术研发人员:吴勇军
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1