The invention discloses a data extraction method based on load mass data migration, the implementation process is as follows: first, data extraction, by creating a temporary user, so that the external tables and data source separation, massive data parallel segmentation generated a number of dump documents; then loading data, namely the analysis and processing of data the conversion, filtering the abnormal data, the data bulk import the data transfer to the target data source. One of the disclosed data extracting and loading methods of massive data migration based on compared with the prior art, can quickly be massive data extraction and loading from various data sources, and the influence on the data source of the system is very small, to ensure the accuracy of the data, to minimize the impact on the business system, practical, applicable scope widely, has the very good application value.
【技术实现步骤摘要】
一种基于海量数据迁移的数据抽取加载方法
本专利技术涉及数据迁移
,具体地说是一种基于海量数据迁移的数据抽取加载方法。
技术介绍
在数据库海量数据迁移时,其一般具有以下需求:1、数据库版本异构版本升级:如Oralce8i升级到9i,甚至是Oracle10g,等等;2、操作系统升级:如AIX4.3升级5.2,甚至是HPUnix环境下,等等;3、磁盘阵列扩容:从老的磁盘升级到新的、其他不同厂家的高端磁盘中,等等。但是在实际迁移过程中,也存在以下问题:1、大数据迁移时,数据抽取及加载消耗大量物理资源并且耗时无法保证,一旦加载出现错误,需重新开始,费力费时。2、减少大数据迁移对源数据产生的影响,降低事故产生几率。3、大数据迁移时,数据加载耗时过长,容易造成数据损坏或丢失。基于以上现状,本专利技术提出一种基于海量数据迁移的数据抽取加载方法,来解决上述问题。
技术实现思路
本专利技术的技术任务是针对以上不足之处,提供一种基于海量数据迁移的数据抽取加载方法。一种基于海量数据迁移的数据抽取加载方法,其实现过程为:首先进行数据抽取,通过创建临时用户,使外部表与数据源分离,对海量数据进行分区并行切分产生若干个dump文件;然后进行数据加载,即对数据进行解析与处理,转换过滤异常数据,最终采用批量导入数据的方式将数据迁移到目标数据源中。所述临时用户是指只读用户、外部表用户,其中只读用户具有数据源中的select权限;外部表用户,该用户通过创建外部表生成dump文件,外部表用户继承只读用户中的select权限。当开始抽取数据的时候,首先查找是否有权限读取数据,满足权限条件后,开始生 ...
【技术保护点】
一种基于海量数据迁移的数据抽取加载方法,其特征在于,其实现过程为:首先进行数据抽取,通过创建临时用户,使外部表与数据源分离,对海量数据进行分区并行切分产生若干个dump文件;然后进行数据加载,即对数据进行解析与处理,转换过滤异常数据,最终采用批量导入数据的方式将数据迁移到目标数据源中。
【技术特征摘要】
1.一种基于海量数据迁移的数据抽取加载方法,其特征在于,其实现过程为:首先进行数据抽取,通过创建临时用户,使外部表与数据源分离,对海量数据进行分区并行切分产生若干个dump文件;然后进行数据加载,即对数据进行解析与处理,转换过滤异常数据,最终采用批量导入数据的方式将数据迁移到目标数据源中。2.根据权利要求1所述的一种基于海量数据迁移的数据抽取加载方法,其特征在于,所述临时用户是指只读用户、外部表用户,其中只读用户具有数据源中的select权限;外部表用户,该用户通过创建外部表生成dump文件,外部表用户继承只读用户中的select权限。3.根据权利要求1所述的一种基于海量数据迁移的数据抽取加载方法,其特征在于,当开始抽取数据的时候,首先查找是否有权限读取数据,满足权限条件后,开始生成外部表dump,一个表可并行生成若干个dump。4.根据权利要求3所述的一种基于海量数据迁移的数据抽取...
【专利技术属性】
技术研发人员:董志鹏,徐兵兵,丁庆申,郭凤,
申请(专利权)人:山东浪潮商用系统有限公司,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。