数据增量更新方法技术

技术编号：28223032 阅读：15 留言：0更新日期：2021-04-28 09:50

本发明专利技术揭示了数据增量更新方法，包括：数据配置步骤，对来自消息队列的数据进行配置，包括以数据本身日期为分区进行配置的第一Flume和以数据采集日期为分区进行配置的第二Flume，经第一Flume写入为第一ODS数据，经第二Flume写入为第二ODS数据；数据初始化步骤，对DW数据进行初始化，从第一ODS数据中选取满足筛选条件的分区作为DW最新分区；数据合并步骤，将截止到当前的第二ODS数据作为最新写入数据，将DW最新分区和最新写入数据进行合并并进行标记；数据替换步骤，将合并数据写回DW最新分区覆盖原数据；更新判定步骤，在包含合并数据的DW中执行更新判定，标记参与更新判定操作；数据更新步骤，如果判断存在更新，则将带有标记的数据同步至数据库进行增量更新。标记的数据同步至数据库进行增量更新。标记的数据同步至数据库进行增量更新。

全部详细技术资料下载

【技术实现步骤摘要】
数据增量更新方法

[0001]本专利技术涉及软件
，更具体地说，涉及以数据库和数据仓库技术。

技术介绍

[0002]数据正在成为一种重要的资源，越来越多的应用都会调用或者存储大量的数据用于应用服务，或者对保存的数据进行分析运算来提升自身的功能。海量数据的存储和管理正在成为一个重要的问题。
[0003]目前的数据平台大多采用数据库(DB)+操作数据存储器(ODS)+数据仓库(DW)的架构。图1揭示了数据平台的架构的示意图，包括数据库DB 101、操作数据存储器ODS 102和数据仓库DW 103。数据库(Database)层多为关系型数据库，用于保存底层数据以及数据之间的关联关系。操作数据存储器(Operational Data Store)介于数据库DB和数据仓库(Data Warehouse)之间，ODS可以按照主题提供集成的、可变的当前数据的集合，ODS的数据源可以来自数据库DB，也可以接入其他的数据接收系统接收外来数据。ODS可以根据数据仓库DW的要求为数据仓库提供指定数据，可以认为是数据仓库的数据过渡区。数据仓库DW更多地是面向运用，数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non
‑
Volatile)、反映历史变化(Time Variant)的数据集合。
[0004]在这个架构体系中，数据库DB负责数据的维护和更新，所有的数据更改或者更新都需要在数据库中进行维护。数据仓库D...

【技术保护点】

【技术特征摘要】
1.一种数据增量更新方法，用于在由数据库、操作数据存储器(ODS)和数据仓库(DW)构成的存储架构中对数据进行增量更新，其特征在于，该数据增量更新方法包括：数据配置步骤，对来自消息队列的数据进行配置，包括以数据本身日期为分区进行配置的第一Flume和以数据采集日期为分区进行配置的第二Flume，经第一Flume写入DW的数据为第一ODS数据，经第二Flume写入DW的数据为第二ODS数据；数据初始化步骤，对DW数据进行初始化，从经第一Flume写入DW的第一ODS数据中选取满足筛选条件的分区作为DW最新分区；数据合并步骤，将截止到当前的经第二Flume写入DW的第二ODS数据作为最新写入数据，将DW最新分区和最新写入数据进行合并，合并过程中对DW最新分区和最新写入数据进行标记；数据替换步骤，将合并数据写回DW最新分区覆盖原数据；更新判定步骤，在包含所述合并数据的DW中执行更新判定操作，判断是否存在更新，所述标记参与所述更新判定操作；数据更新步骤，如果在更新判定步骤中判断存在更新，则将带有所述标记的数据同步至数据库进行增量更新。2.如权利要求1所述的数据增量更新方法，其特征在于，所述数据配置步骤中，第一Flume或者第二Flume的分区粒度...

【专利技术属性】
技术研发人员：王泰舟，
申请(专利权)人：食亨上海科技服务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人