一种数据处理方法及装置制造方法及图纸

技术编号：38683078 阅读：12 留言：0更新日期：2023-09-02 22:55

本申请提供一种数据处理方法及装置，该方法包括：构建数据处理模型，并将数据处理模型放入调度队列；接收待处理数据；通过数据处理模型对待处理数据进行预处理，得到预处理数据；通过数据处理模型对待处理数据进行分流处理，得到分流处理结果。可见，该方法及装置能够替代IBM主机对数据进行分布式处理，实现数据处理的自主可控，同时有效减少了业务和技术的耦合度，从而显著降低业务开发人员的时间成本，并在提高了系统的可用性的同时也大大降低了运维成本。了运维成本。了运维成本。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法及装置

[0001]本申请涉及数据处理
，具体而言，涉及一种数据处理方法及装置。

技术介绍

[0002]目前，IBM主机(mainFrame)作为计算机中的顶级产品，由于其安全性(尚无黑客可以对其进行攻击)和高可靠性(号称全年宕机时间不超过5分钟)一直被用于金融、证券等行业，而DFSORT(基于IBM z/os为数据分析提供排序、合并、拷贝、过滤、解析、编辑、重新格式化、求和等功能)与ICETOOL(一个多用途的DFSORT使用程序，在一个作业步中对一个或多个数据集执行多个操作)作为IBM两款针对数据分析的产品，仍旧在国内大型银行的金融业务中扮演着重要角色。然而，在实践中发现，IBM主机具有封闭集中式架构，无法进行数据处理的自主可控，同时，使用IBM主机需要高昂的采购与维护成本。

技术实现思路

[0003]本申请实施例的目的在于提供一种数据处理方法及装置，能够替代IBM主机对数据进行分布式处理，实现数据处理的自主可控，同时有效减少了业务和技术的耦合度，从而显著降低业务开发人员的时间成本，并在提高了系统的可用性的同时也大大降低了运维成本。
[0004]本申请实施例第一方面提供了一种数据处理方法，包括：
[0005]构建数据处理模型，并将所述数据处理模型放入调度队列；
[0006]接收待处理数据；
[0007]通过所述数据处理模型对所述待处理数据进行预处理，得到预处理数据；
[0008]通过所述数据处理模型对所述待处理数据进行分流处理，得到分流...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，其特征在于，包括：构建数据处理模型，并将所述数据处理模型放入调度队列；接收待处理数据；通过所述数据处理模型对所述待处理数据进行预处理，得到预处理数据；通过所述数据处理模型对所述待处理数据进行分流处理，得到分流处理结果。2.根据权利要求1所述的数据处理方法，其特征在于，所述构建数据处理模型，包括：接收企业级作业调度平台下发的至少一个批处理作业；其中，所述批处理作业包括一个或多个作业步，且每个作业步之间有依赖关系；对所述批处理作业进行解析，得到解析数据；根据所述解析数据构建为以作业步为单位的数据处理模型；其中，所述数据处理模型包括数据输入上下文、数据处理逻辑上下文以及数据输出上下文。3.根据权利要求1所述的数据处理方法，其特征在于，所述通过所述数据处理模型对所述待处理数据进行预处理，得到预处理数据，包括：确定所述数据处理模型的输入上下文；获取所述输入上下文中定义的元数据；其中，所述元数据包括数据源类型、数据格式、数据分区以及数据代理方式；根据所述元数据对待处理数据进行预处理，得到预处理数据。4.根据权利要求3所述的数据处理方法，其特征在于，所述通过所述数据处理模型对所述待处理数据进行分流处理，得到分流处理结果，包括：确定所述数据处理模型的处理逻辑上下文；获取所述处理逻辑上下文中的作业步JCL文件；通过预先配置的语义解析器将所述作业步JCL文件进行格式转换，得到预设文件格式的目标文件；其中，所述目标文件包括TYPE字段部分、INPUT字段部分以及OUTPUT字段部分；根据所述元数据加载所述预处理数据，并结合所述目标文件对所述预处理数据进行分流处理，得到分流处理结果。5.根据权利要求4所述的数据处理方法，其特征在于，所述结合所述目标文件对所述预处理数据进行分流处理，得到分流处理结果，包括：根据所述目标文件，按照数据大小对所述预处理数据进行分流，得到第一分流数据和第二分流数据；其中，所述第一分流数据的数据大小小于预设阈值，所述...

【专利技术属性】
技术研发人员：张玉龙，姚孝辉，
申请(专利权)人：平安银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人