【技术实现步骤摘要】
一种适应多种数据库数据格式的数据导入导出方法及装置
本专利技术属于计算机技术应用领域,特别是涉及到一种适应多种数据库数据格式的数据导入导出方法。
技术介绍
随着社会和计算机技术的不断发展,越来越多的数据被记录于各种系统中,以便于企业进行经营分析,并作为企业管理,决策的重要基础。ETL技术则是目前实现数据迁移的主要技术。它完成了在企业内部的ERP、CRM, SCM、数据库、数据仓库,以及其它重要的内部系统之间无缝地共享和交换数据的需要。传统的E T L程序主要由三步组成:Extract-Transform_Load,用来描述将数据从来源端经过抽取(Extract)、转换(Transform)、加载(Load)至目的端的过程。其中: (I)数据抽取:从源数据源系统抽取目的数据源系统需要的数据; (2)数据转换:将从源数据源获取的数据按照业务需求,转换成目的数据源要求的形式,并对错误、不一致的数据进行清洗和加工; (3)数据加载:将转换后的数据装载到目的数据源。 但是随着被记录的数据量的不断增大,使得数据在各个系统间进行迁移的时间成本越来越高;而且,在实施数据迁移的过程中,由于不同用户提供的数据可能来自不同的途径,其数据内容、数据格式和数据质量千差万别,有时甚至会遇到数据格式不能转换或数据转换格式后丢失信息等棘手问题,严重阻碍了数据在各系统中的流动与共享。因此,如何对数据进行有效的数据迁移已成为增强企业商业竞争力的必然选择。
技术实现思路
本专利技术主要解决的是如何有效地完成数据抽取转换以便于后续加载的问题,尤其是在数据很 ...
【技术保护点】
一种适应多种数据库数据格式的数据导入导出方法,其特征在于,包括如下步骤:(1)空值处理:捕获字段空值进行非空处理;(2)数据替换:实现无效数据、缺失数据的替换;(3)规范化数据格式:实现字段格式约束定义,对于数据源中格式多样的数据,自定义导出格式;(4)拆分数据:依据业务需求对字段可进行分解;(5)分隔符设置:设置各种分隔符。
【技术特征摘要】
1.一种适应多种数据库数据格式的数据导入导出方法,其特征在于,包括如下步骤: (1)空值处理:捕获字段空值进行非空处理; (2)数据替换:实现无效数据、缺失数据的替换; (3)规范化数据格式:实现字段格式约束定义,对于数据源中格式多样的数据,自定义导出格式; (4)拆分数据:依据业务需求对字段可进行分解; (5)分隔符设置:设置各种分隔符。2.根据权利要求1所述的适应多种数据库数据格式的数据导入导出方法,其特征在于,所述步骤(I)中非空处理包括进行加载或替换为其他含义数据。3.根据权利要求1所述的适应多种数据库数据格式的数据导入导出方法,其特征在于,所述步骤(3)中格式多样的数据包括时间、数值、字符。4.根据权利要求1所...
【专利技术属性】
技术研发人员:单文伟,王傲雷,崔维力,武新,
申请(专利权)人:天津南大通用数据技术股份有限公司,
类型:发明
国别省市:天津;12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。