【技术实现步骤摘要】
数据并行处理方法、装置、设备及存储介质
本专利技术实施例涉及数据处理
,尤其涉及一种数据并行处理方法、装置、设备及存储介质。
技术介绍
商业银行核心系统基于IBM大型机构建,大型机上的联机、批处理基于文件,并在计算过程中没有网络损耗,但是从大型机下移到X86开放系统后,X86系统CPU、网络通讯、IO等损耗增加,单一机器无法满足大型银行10亿级以上的业务处理,通过对业务数据进行业务领域垂直拆分,数据量水平拆分来解决数据库瓶颈,但是在批处理中,一个批次的数据文件达到百万级,如果按由单台进行处理,仍然无法实现高效的计算。因而提高数据的处理效率显得尤为重要。
技术实现思路
本专利技术实施例提供一种数据并行处理方法、装置、设备及存储介质,通过数据分片,把一个任务按一定比例拆分成多片,并在不同机器上并行运行,来减少单个作业处理的批处理时间,从而提高数据的处理效率。第一方面,本专利技术实施例提供了一种数据并行处理方法,包括:若待处理任务支持分片,获取数据拆分规则;根据所述拆分规则将所述待 ...
【技术保护点】
1.一种数据并行处理方法,其特征在于,包括:/n若待处理任务支持分片,获取数据拆分规则;/n根据所述拆分规则将所述待处理任务拆分为多个子任务;/n将所述多个子任务分配至对应的线程进行处理,获得多个子结果;/n将所述多个子结果进行合并,获得数据处理结果。/n
【技术特征摘要】
1.一种数据并行处理方法,其特征在于,包括:
若待处理任务支持分片,获取数据拆分规则;
根据所述拆分规则将所述待处理任务拆分为多个子任务;
将所述多个子任务分配至对应的线程进行处理,获得多个子结果;
将所述多个子结果进行合并,获得数据处理结果。
2.根据权利要求1所述的方法,其特征在于,获取数据拆分规则,包括:
根据所述待处理任务的身份标识码获取分片参数;
根据所述分片参数确定数据拆分规则。
3.根据权利要求1所述的方法,其特征在于,根据设定拆分规则将所述待处理任务拆分为多个子任务,包括:
注册拆分表;
将拆分的多个子任务的信息登记至所述拆分表中;所述拆分表用于记录拆分进度。
4.根据权利要求3所述的方法,其特征在于,所述子任务的信息包括:子任务的身份识别码、输入文件路径、输出文件路径及记录条数。
5.根据权利要求3所述的方法,其特征在于,将所述多个子任务分配至对应的线程进行处理,获得多个子结果,包括:
根据子任务的信息按照锁机制将所述多个子任务分配至对应的线程进行处理,获得多个子结果。
6.一种数据并行处...
【专利技术属性】
技术研发人员:陈军,唐成山,
申请(专利权)人:中国建设银行股份有限公司,建信金融科技有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。