一种基于Spark技术的数据模转迁移方法、服务器及存储介质技术

技术编号：37722974 阅读：9 留言：0更新日期：2023-06-02 00:24

本发明专利技术提供一种基于Spark技术的数据模转迁移方法、服务器及存储介质，属于网络数据迁移技术领域，包括以下步骤：S1、预配置若干json文件，每个json文件包括若干节点，每个节点包含数据模转规则以及数据连接信息；按照每个节点的数据模转规则转换后的数据作为下一节点的输入数据；S2、启动Spark应用程序，输入参数，所述输入参数与预配置的json文件单独对应；S3、根据输入参数匹配对应的json预配置文件，Spark应用程序对该json配置文件进行解析；S4、根据解析结果对长途网络资源数据进行模转，并根据数据连接信息，对数据进行迁移，本发明专利技术能简化数据迁移流程，且提升数据迁移效率和覆盖面。面。面。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于Spark技术的数据模转迁移方法、服务器及存储介质

[0001]本专利技术属于网络数据迁移
，具体涉及一种基于Spark技术的数据模转迁移方法、服务器及存储介质。

技术介绍

[0002]在国家推动企业上云发展战略的大背景下，中国电信信息化企业对于IT系统解耦上云的需求日趋迫切，业务系统解耦上云必然伴随着数据模型转换及数据迁移处理，为此能够支撑中国电信长途网络资源复杂业务场景的数据模转、数据迁移工具对骨干资源系统IT上云具有重大意义，现阶段市面上的数据迁移在技术仍有许多不足，如：1、反复修改代码，迁移应用不够灵活：市面上的数据迁移工具，应用到长途资源迁移场景规则变化时，往往需要修改迁移代码，重新打包发版后方可实现数据迁移功能，不是足够的灵活，遇到迁移规则不明确的时候，应对的灵活性不足。
[0003]2、不能支撑复杂业务，迁移局限性较高：市面上数据迁移工具仅支持新老模型之间一对一的简单数据迁移，遇到长途资源模型改造，涉及表间关系复杂的数据模型转换迁移场景时，不能够很好的应对，表现出工具的高局限性。
[0004]3、海量数据场景下的迁移效率不足：传统的数据迁移工具在迁移少量数据时体现高效的数据迁移性能，当遇到长途网络资源海量数据、复杂场景的数据迁移时，会存在应用相应不及时，数据迁移效率低下的问题，往往不能及时高效的完成用户所需。

技术实现思路

[0005]本专利技术的目的是为了解决
技术介绍
中提及的问题，提供一种基于Spark技术的数据模转迁移方法、服务器及存储介质，能简化数据迁...

【技术保护点】

【技术特征摘要】
1.一种基于Spark技术的数据模转迁移方法，其特征在于，包括以下步骤：S1、预配置若干json文件，每个json文件包括若干节点，每个节点包含数据模转规则以及数据连接信息；按照每个节点的数据模转规则转换后的数据作为下一节点的输入数据；S2、启动Spark应用程序，输入参数，所述输入参数与预配置的json文件单独对应；S3、根据输入参数匹配对应的json预配置文件，Spark应用程序对该json配置文件进行解析；S4、根据解析结果对长途网络资源数据进行模转，并根据数据连接信息，对数据进行迁移。2.根据权利要求1所述的一种基于Spark技术的数据模转迁移方法，其特征在于：步骤S1中json文件每个节点包含的数据模转规则包括以下三种：规则一、简单转换，数据按照字段对应直接转换；规则二、单表关联，数据按照单张映射关系表进行转换；规则三、多表关联，数据按照多张映射关系表依次进行转换。3.根据权利要求2所述的一种基于Spark...

【专利技术属性】
技术研发人员：党咏欣，张彬，郭建章，李斌，曲欣，傅博，
申请(专利权)人：中电信数智科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人