【技术实现步骤摘要】
数据格式转换方法及装置
本专利技术涉及大数据处理
,尤其涉及一种数据格式转换方法及装置。
技术介绍
本部分旨在为权利要求书中陈述的本专利技术实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。在实际业务场景中,业务部门可以从多渠道获取客户数据。面对不同的数据源,获取的客户数据的格式也多种多样,例如文本数据、后台oracle导出数据、excel数据,也可能是hive、hbase或mango等大数据等。在接收到客户数据之后,往往需要将其转换为统一格式的数据,以便于后续按照相同的逻辑进行业务处理。现有的数据格式转换方案,不同格式的数据需要分别处理,这样有多少种数据就需要处理多少次,重复工作量很大,处理周期长;同时,再每处理完一种格式的数据之后处理下一种格式的数据之时,需要按照下一种数据的格式将全部代码更改一遍,更改后的代码需要全盘测试,导致测试工作量大,还要求开发人员排查问题能力强,以便于及时修改代码测试中出现的问题,否则严重影响后续的数据处理过程的进行。可见,如何提供一种快速、可靠且实现简便的数据格式转换方法,成为目前亟待解决的问题。
技术实现思路
本专利技术实施例提供一种数据格式转换方法,用以快速、可靠、简便的实现数据格式转换过程,该方法包括:接收用户设定的数据源地址和目标地址,以及所需引用的loader、filter、service类,以及设定了目标导入规则的exporter,其中,loader用于读取至少一种指定格式的数据,目标导入规则定义了以目 ...
【技术保护点】
1.一种数据格式转换方法,其特征在于,所述方法包括:/n接收用户设定的数据源地址和目标地址,以及所需引用的loader、filter、service类,以及设定了目标导入规则的exporter,其中,loader用于读取至少一种指定格式的数据,目标导入规则定义了以目标地址存储数据的格式向目标地址写入数据;/n启动loader线程从数据源地址中读取目标数据,将目标数据转换为实体类数据;/n将实体类数据传入filter,启动filter线程按照预设的数据过滤规则对实体类数据进行清洗过滤;/n将清洗过滤后的实体类数据传入service类,启动service线程按照预设的业务处理逻辑对清洗过滤后的实体类数据进行逻辑处理;/n启动exporter线程读取逻辑处理后的实体类数据,并将逻辑处理后的实体类数据写入目标地址。/n
【技术特征摘要】
1.一种数据格式转换方法,其特征在于,所述方法包括:
接收用户设定的数据源地址和目标地址,以及所需引用的loader、filter、service类,以及设定了目标导入规则的exporter,其中,loader用于读取至少一种指定格式的数据,目标导入规则定义了以目标地址存储数据的格式向目标地址写入数据;
启动loader线程从数据源地址中读取目标数据,将目标数据转换为实体类数据;
将实体类数据传入filter,启动filter线程按照预设的数据过滤规则对实体类数据进行清洗过滤;
将清洗过滤后的实体类数据传入service类,启动service线程按照预设的业务处理逻辑对清洗过滤后的实体类数据进行逻辑处理;
启动exporter线程读取逻辑处理后的实体类数据,并将逻辑处理后的实体类数据写入目标地址。
2.根据权利要求1所述的方法,其特征在于,在接收用户设定的所需引用的service类之前,所述方法还包括:
新增service类,利用新增的service类继承service父类;
接收用户设定的业务处理逻辑,将业务处理处理逻辑写入继承后的service类的excute方法,得到可以被引用的service类。
3.根据权利要求1所述的方法,其特征在于,启动service线程按照预设的业务处理逻辑对清洗过滤后的实体类数据进行逻辑处理,包括:
当业务处理逻辑被用户标识为复杂逻辑时,利用service线程执行excute方法,将清洗过滤后的实体类数据缓存至redis;
从redis中取出缓存的数据进行逻辑处理。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
接收用户重写的service类的atlast方法,所述atlast方法用于指示当数据源地址中所有数据传入service类之后进行逻辑处理;
在将清洗过滤后的实体类数据缓存至redis之后,所述方法还包括:
启动service线程执行atlast方法,从redis中取出清洗过滤后的实体类数据存入atlast结果,直至从数据源地址中接收的所有数据经过处理后存入atlast结果;
取出atlast结果中存储的所有清洗过滤后的实体类数据进行逻辑处理。
5.根据权利要求1所述的方法,其特征在于,
针对loader线程在一次读取过程中读取的目标数据,按照loader线程处理、filter线程处理、service线程处理和exporter线程处理的顺序依次处理目标数据;
针对所有目标数据,由至少一个loader线程、至少一个filter线程、至少一个service线程和至少一个exporter线程同时执行处理过程。
6.一种数据格式转换装置,其特征在于,所述装置包括:
接收模块,用于接收用户设定的数据源地址和目标地址,以及所需引用的loader、filter、servi...
【专利技术属性】
技术研发人员:李杨帆,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。