一种分布式架构下海量数据不一致的发现与处置方法技术

技术编号:35146420 阅读:26 留言:0更新日期:2022-10-05 10:23
一种分布式架构下海量数据不一致的发现与处置方法,包括以下步骤:各业务系统通过阿里大数据开发平台将系统数据集成至离线数据平台;根据具体的核对需求编写SQL校验规则录入至离线核对平台;配置该规则对应的告警任务,设置执行时间、执行频率、工单通知方式及通知人信息;在设定的执行时间,告警任务将连接数据仓库数据源,通过SQL执行引擎执行SQL规则;若执行结果差异数大于0,将自动创建工单并通过设置的通知方式通知到责任人;责任人收到工单提醒后进行差异排查。本发明专利技术克服了现有技术的不足,能够基于大数据离线数据仓库的技术解决方案,与数据仓库结合能够达到最佳实施效果。果。果。

【技术实现步骤摘要】
一种分布式架构下海量数据不一致的发现与处置方法


[0001]本专利技术涉及数据处理
,具体涉及一种分布式架构下海量数据不一致的发现与处置方法。

技术介绍

[0002]近年来,互联网保险逐渐崭露头角,在所有互联网金融的子行业中,成为最具发展前景的细分子行业。互联网保险具有高频化、碎片化的特性。以退运险为例,保险核心业务系统每天需处理百万、千万级交易量,随着交易量的提升,系统逐步向分布式架构演进,海量业务交易运转在分布式架构下,若不能及时发现系统间关键业务数据错漏重等数据质量问题,将给保司带来巨大的经济损失和监管风险。
[0003]目前主要是由各个业务系统自建守护任务,在业务低峰期通过运行系统间的核对接口进行定时检查,发现问题触发告警通知,技术 owner收到告警提醒后定位修复问题。但在分布式架构下,保险核心业务系统有几十个子系统,各个业务系统自建守护任务,需要系统的技术人员针对上下游系统特性设计不同的接口调度任务进行核验,需要在核对上投入大量资源;并且守护任务在进行接口检查时,当需检查的数据量级达到百万千万级时,会在业务数据库上进行大量并发查询操作,对系统实时关键业务造成性能影响。

技术实现思路

[0004]针对现有技术的不足,本专利技术提供了一种分布式架构下海量数据不一致的发现与处置方法,克服了现有技术的不足,能够基于大数据离线数据仓库的技术解决方案,与数据仓库结合能够达到最佳实施效果。
[0005]为实现以上目的,本专利技术通过以下技术方案予以实现:
[0006]一种分布式架构下海量数据不一致的发现与处置方法,包括以下步骤:
[0007]步骤S1:各业务系统通过阿里大数据开发平台将系统数据集成至 maxcomputer离线数据平台;
[0008]步骤S2:根据具体的核对需求编写SQL校验规则录入至离线核对平台,形成核对规则集合;
[0009]步骤S3:在配置完成SQL规则后,配置该规则对应的告警任务,设置执行时间、执行频率、工单通知方式及通知人信息;
[0010]步骤S4:告警任务配置成功后,在设定的执行时间,告警任务将连接数据仓库数据源,通过SQL执行引擎执行SQL规则;
[0011]步骤S5:告警任务执行完成后,若执行结果差异数大于0,将自动创建工单并通过设置的通知方式通知到责任人;
[0012]步骤S6:责任人收到工单提醒后进行差异排查,若是误报,标记差异为忽略并关闭工单;若不是误报,修复系统bug,任务再次运行后差异消除后关闭工单。
[0013]优选地,所述步骤S1中,阿里大数据开发平台通过读取数据库的二进制日志将业
务数据库的表和数据按时效要求同步至数据仓库,对业务系统无任何侵入操作。
[0014]本专利技术提供了一种分布式架构下海量数据不一致的发现与处置方法。具备以下有益效果:当分布式架构下各业务系统数据出现不一致问题时,通过定时执行各业务系统布署的核对脚本会发现问题并通知业务系统负责人,同时会创建相应待处理工单以保证问题处置闭环。
附图说明
[0015]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对现有技术描述中所需要使用的附图作简单地介绍。
[0016]图1本专利技术的步骤流程图。
具体实施方式
[0017]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述。
[0018]实施例一
[0019]如图1所示,一种分布式架构下海量数据不一致的发现与处置方法,包括以下步骤:
[0020]步骤S1:各业务系统通过阿里大数据开发平台DataWorks将系统数据集成至maxcomputer离线数据平台;DateWorks通过读取数据库的二进制日志(binlog)将业务数据库的表和数据按时效要求同步至数据仓库,对业务系统无任何侵入操作;
[0021]步骤S2:技术人员根据具体的核对需求编写SQL校验规则并录入至离线核对平台,形成核对规则集合;
[0022]步骤S3:在配置完成SQL规则后,配置该规则对应的告警任务,设置执行时间、执行频率、工单通知方式及通知人信息;
[0023]步骤S4:告警任务配置成功后,在设定的执行时间,告警任务将连接数据仓库数据源,通过SQL执行引擎执行SQL规则;
[0024]步骤S5:告警任务执行完成后,若执行结果差异数大于0,将自动创建工单并通过设置的通知方式通知到责任人;
[0025]步骤S6:责任人收到工单提醒后进行差异排查,若是误报,标记差异为忽略并关闭工单;若不是误报,修复系统bug,任务再次运行后差异消除后关闭工单。
[0026]通过上述步骤,当分布式架构下各业务系统数据出现不一致问题时(引发该问题的原因包括但不限于业务系统bug,消息中间件故障,数据被篡改等等),通过定时执行各业务系统布署的核对脚本会发现问题并通知业务系统负责人,同时会创建相应待处理工单以保证问题处置闭环。
[0027]实施例二
[0028]举例说明:当理赔案件核赔通过后,需要通过支付中心打款给用户,在分布式架构下,理赔系统和支付系统为独立的两个系统,为了确保理赔系统的核赔金额和支付中心打款至用户的金额是一致的,需要对理赔系统的理算书信息表和支付中心的打款流水表进行数据一致性核对;
[0029](1):先将涉及到的业务表通过dataworks同步任务集成至 maxcomputer离线数据平台,t_clm_payment(理赔系统理算信息表名) 集成至maxcomputer后表名为ods_f_clm_payment,t_fin_pay_flow (支付系统支付流水表名)集成至maxcompter后表名为 ods_f_fin_pay_flow;
[0030](2):技术人员根据具体的核对需求编写SQL校验规则并录入至离线核对平台,核对理赔系统理算信息表与支付中心打款流水表数据量、支付金额、支付币种、支付账号、支付账号名是否一致,规则名称命名为“理赔系统理算支付表与支付中心打款流水信息一致性校验”;
[0031]在本实施例汇总,编写SQL校验规则如下:
[0032][0033][0034](3)创建告警任务,把将“理赔系统理算支付表与支付中心打款流水信息一致性校验”规则添加至告警任务,任务设置为每天9:00运行一次,告警订阅为通过邮件发送给责任人;
[0035](4)离线核对平台每天9:00将执行一次本规则,若执行结果数据行数大于0,将自动创建一张待处理工单并邮件通知责任人;
[0036](5)责任人调查分析告警原因后,如果确认是bug,将进行bug 修复,待下一次执行任务后确认差异是否消除,若消除则关闭工单;如果确认是误报,将核对差异标记为忽略,
关闭工单。
[0037]以上实施例仅用以说明本专利技术的技术方案,而非对其限制;尽管参照前述实施例对本专利技术进行了详细的说明,本领域的普通技术人员应当理解本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分布式架构下海量数据不一致的发现与处置方法,其特征在于,包括以下步骤:步骤S1:各业务系统通过阿里大数据开发平台将系统数据集成至maxcomputer离线数据平台;步骤S2:根据具体的核对需求编写SQL校验规则录入至离线核对平台,形成核对规则集合;步骤S3:在配置完成SQL规则后,配置该规则对应的告警任务,设置执行时间、执行频率、工单通知方式及通知人信息;步骤S4:告警任务配置成功后,在设定的执行时间,告警任务将连接数据仓库数据源,通过SQL执行引擎执行SQL规则...

【专利技术属性】
技术研发人员:崔瑞瑾邱梅唐小燕廉奎
申请(专利权)人:国泰财产保险有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1