【技术实现步骤摘要】
基于Hadoop的数据更新方法、装置、系统及介质
本专利技术涉及金融科技(Fintech)数据处理
,尤其涉及一种基于Hadoop的数据更新方法、装置、系统及介质。
技术介绍
随着金融科技,尤其是互联网科技金融(Fintech)的不断发展,越来越多的技术(如分布式、区块链Blockchain、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求。目前,很多企业都已搭建各自的Hadoop大数据平台,基于该Hadoop大数据平台,企业内各个应用系统数据都在该Hadoop大数据平台中进行共享,进而形成各自的数据仓库和针对各个不同主题而建成的若干个数据集市,其中,数据仓库中存储的是某个应用系统的数据,数据集市存储的是各个应用系统中,同一主题的数据。当某个数据集市依赖的某个上游数据库表的数据发生数据重跑时,会通知下游数据库表随着上游数据库表的变化而被动进行重新跑批。这个通知的实现往往依靠一个全局的分布式任务调度平台。当上游某个数据库表发生变化时,Hadoop大数据平台会告知该任务调度平台,由该任务调度平台生成对应的通知发送至下游数据库表对应客户端中,以触发下游数据库表的数据重新处理。当上游数据库表和下游数据库表之间数据的血缘关系比较复杂时,任务调度平台无法确定被影响的所有下游数据库表,导致上游数据库表和下游数据库表之间数据的血缘关系更新不完全,从而导致上游数据库表和下游数据库表之间数据的血缘关系不准确,即导致图形数据库中数据库表之间的血缘关系不准确。
技术实现思路
本专利技术的主要目的在于提供一种基于Hadoop的数据更新方法、装置、系统及介质,旨在解决现 ...
【技术保护点】
1.一种基于Hadoop的数据更新方法,其特征在于,所述基于Hadoop的数据更新方法包括以下步骤:当检测到Hadoop集群接收到客户端发送的跑批任务后,在所述Hadoop集群中对所述跑批任务进行编译,得到所述跑批任务对应的任务语句;在数据治理系统中对所述任务语句进行解析,得到所述任务语句对应各个数据库表的逻辑关系;根据所述逻辑关系更新预设图形数据库中对应数据库表的血缘关系。
【技术特征摘要】
1.一种基于Hadoop的数据更新方法,其特征在于,所述基于Hadoop的数据更新方法包括以下步骤:当检测到Hadoop集群接收到客户端发送的跑批任务后,在所述Hadoop集群中对所述跑批任务进行编译,得到所述跑批任务对应的任务语句;在数据治理系统中对所述任务语句进行解析,得到所述任务语句对应各个数据库表的逻辑关系;根据所述逻辑关系更新预设图形数据库中对应数据库表的血缘关系。2.如权利要求1所述的基于Hadoop的数据更新方法,其特征在于,若所述任务语句为数据更新语句,则所述当检测到Hadoop集群接收到客户端发送的跑批任务后,在所述Hadoop集群中对所述跑批任务进行编译,得到所述跑批任务对应的任务语句的步骤之后,还包括:在所述Hadoop集群中对所述跑批任务对应数据进行加工,得到加工后的数据;根据所述加工后的数据更新元数据库,得到所述更新后的元数据库;通过所述数据治理系统在所述更新后的元数据库中获取更新后的元数据,并获取所述加工后的数据和所述加工后的数据所在数据库表的表名称;根据所述更新后的元数据和所述加工后的数据更新所述图形数据库中所述表名称对应的数据库表,并将更新后的数据库表确定为上游数据库表;在所述根据所述逻辑关系更新预设图形数据库中对应数据库表的血缘关系的步骤之后,根据所述血缘关系确定所述上游数据库表对应的下游数据库表;根据所述更新后的元数据和所述加工后的数据更新所述下游数据库表。3.如权利要求2所述的基于Hadoop的数据更新方法,其特征在于,所述根据所述血缘关系确定所述上游数据库表对应的下游数据库表的步骤之后,还包括:发送提示信息给所述下游数据库表对应的客户端,以供所述客户端根据所述提示信息提示用户,所述下游数据库表对应的上游数据库表已更新;若接收到所述下游数据库表对应客户端发送的更新指令,则根据所述更新后的元数据和所述加工后的数据更新所述下游数据库表。4.如权利要求2所述的基于Hadoop的数据更新方法,其特征在于,所述通过所述数据治理系统在所述更新后的元数据库中获取更新后的元数据的步骤包括:通过所述数据治理系统中预设的监听程序获取所述更新后的元数据库的监听日志;解析所述监听日志,获取所述监听日志中的目标关键字;根据所述目标关键字获取所述更新后的元数据库中更新后的元数据。5.如权利要求1所述的基于Hadoop的数据更新方法,其特征在于,若所述任务语句为数据查询语句,则所述当检测到Hadoop集群接收到客户端发送的跑批任务后,在所述Hadoop集群中对所述跑批任务进行编译,得到所述跑批任务对应的任务语句的步骤之后,还包括:在所述Hadoop集群中获取所述数据查询语句对应的目标数据;将所述目标数据发送给所述跑批任务对应的客户端。6.如权利要求1所述的基于Hadoop的数据更新方法,其特征在于,所述在数据治理系统中对所述任务语句进行解析,得到所述任务语句对应各个数据库表的逻辑关系的步骤包括:在数据治理系统中对所述任务语句进行解析,得到所述任务语句对应的数据库表;确定所述任务语句对应数据库表中的源表和目标表,根据所述源表和所述目标表确定所述任务语句对应各个数据库表的逻辑关系。7.如权利要求1至6任一项所述的基于Hadoop的数据更新方法,其特征...
【专利技术属性】
技术研发人员:彭陈成,张阳,
申请(专利权)人:深圳前海微众银行股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。