The invention provides a method, system and server for a data warehouse. The method includes: building a multi-layer data processing architecture to process data stratified; extracting the required data from the data source and cleaning the extracted data into data that meets the preset requirements; scheduling and supervising the data processing tasks; and on the multi-layer number. The access rights of the data in the processing architecture are controlled and the overall operation of the data is regulated. The multi-layer data processing architecture includes temporary storage of data acquired from the data source, the core data layer that stores and processes the cleaned data, and organizes the data. The data mart layer corresponding to the data subject and the application layer for the user to process the specific data of user input. The invention can quickly build enterprise data warehouse, reduce the complexity of warehouse construction, shorten the development cycle of building data warehouse, reduce the cost of warehouse development and operation and maintenance, and have a wide application prospect.
【技术实现步骤摘要】
一种数据仓库的构建方法、系统及服务器
本专利技术涉及计算机软件
,具体为一种数据仓库的构建方法、系统及服务器。
技术介绍
数据仓库,英文名称为DataWarehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库中获取信息的问题。数据仓库的特征在于面向主题、集成性、稳定性和时变性。数据仓库,由数据仓库之父比尔·恩门(BillInmon)于1990年提出,主要功能仍是将组织透过资讯系统之联机事务处理(OLTP)经年累月所累积的大量资料,透过数据仓库理论所特有的资料储存架构,作一有系统的分析整理,以利各种分析方法如联机分析处理(OLAP)、数据挖掘(DataMining)之进行,并进而支持如决策支持系统(DSS)、主管资讯系统(EIS)之创建,帮助决策者能快速有效的自大量资料中,分析出有价值的资讯,以利决策拟定及快速回应外在环境变动,帮助建构商业智能(BI)。数据仓库是一个为企业决策者提供数据分析处理的集成、统一的数据平台;其主要用于支持经营管理中的,数据分析、决策支持、数据挖掘、业务报表等;数据仓库的目的是建立一种体系结构化的数据存储环境,将分析决策所需要的大量数据从传统的操作环境中分离出来,使分散、不一致的操作数据转换为集成、统一的信息。主要有以下特点:数据仓库中的数据是在对原 ...
【技术保护点】
1.一种数据仓库的构建方法,其特征在于,所述数据仓库的构建方法包括:构建多层数据处理架构将数据分层处理;从数据源抽取所需的数据并将抽取的数据清洗成符合预设要求的数据;对数据处理任务进行调度和监管;对所述多层数据处理架构中的数据的访问权限进行控制并对数据的整体运行状况进行监管。
【技术特征摘要】
1.一种数据仓库的构建方法,其特征在于,所述数据仓库的构建方法包括:构建多层数据处理架构将数据分层处理;从数据源抽取所需的数据并将抽取的数据清洗成符合预设要求的数据;对数据处理任务进行调度和监管;对所述多层数据处理架构中的数据的访问权限进行控制并对数据的整体运行状况进行监管。2.根据权利要求1所述的数据仓库的构建方法,其特征在于,所述多层数据处理架构包括:临时存储从所述数据源获取的数据的临时存储层、对清洗后的数据进行存储和处理的核心数据层、将数据进行组织形成对应数据主题的数据集市层以及面向用户处理用户输入的具体需求数据的应用层。3.根据权利要求1所述的数据仓库的构建方法,其特征在于,所述从数据源抽取所需的数据中包括:数据抽取选择全量抽取或指定时间戳进行增量抽取并可通过指定字段和过滤条件进行选择性抽取。4.根据权利要求1所述的数据仓库的构建方法,其特征在于,所述将抽取的数据清洗成符合预设要求的数据中包括:将不完整的数据信息补全、将错误数据清除、将重复数据去重以及将数据进行格式转换中的一种或多种组合。5.根据权利要求1所述的数据仓库的构建方法,其特征在于,所述对数据处理任务进行调度包括:将任务进行分组并根据配置的任务之间的依赖关系进行调度或根据设置的任务的优先级进行调度;对数据处理任务进行监管包括:监管任务的新增、暂停和删除、查看任务的运行情况和耗时情况以及重新调度运行失败的任务。6.一种数据仓库的构建系统,其特征在于,所述数据仓库的构建系统包括:分层模块,用于构建多层数据处理架构将数据分层处理;抽取模块,用于从数...
【专利技术属性】
技术研发人员:董林,
申请(专利权)人:上海前隆信息科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。