一种脚本血缘解析方法、装置、存储介质、设备及产品制造方法及图纸

技术编号:38008567 阅读:9 留言:0更新日期:2023-06-30 10:26
本发明专利技术公开了一种脚本血缘解析方法、装置、存储介质、设备及产品。其中方法包括:获取待处理的多个脚本,对于每一所述脚本进行语句段的拆解,得到拆解的语句段;对各所述语句段分别进行血缘解析:在解析过程中对于包括未识别字段的语句段,基于所述未识别字段对应的表信息在公共资产表中进行联动查询,得到所述表信息的查询结果,基于所述查询结果更新所述语句段,并基于所述更新后语句段得到对应的血缘解析结果;基于各所述脚本中每一语句段的血缘解析结果,得到血缘数据。通过对多个脚本进行血缘分析,实现了跨脚本的血缘追溯。同时在分析过程中,避免血缘解析器无法识别的问题,提高了血缘解析的准确性。高了血缘解析的准确性。高了血缘解析的准确性。

【技术实现步骤摘要】
一种脚本血缘解析方法、装置、存储介质、设备及产品


[0001]本专利技术涉及大数据
,尤其涉及一种脚本血缘解析方法、装置、存储介质、设备及产品。

技术介绍

[0002]随着大数据趋势的迅速增长,数据的重要性与日俱增,企业分析数据的诉求越来越强烈。直接基于脚本进行血缘解析能够便捷地为用户分析出脚本内蕴含的表级关系及字段关系。准确的血缘关系可用于解决存量数据迁移难,生产问题排查难,变更影响定位难的三大问题。
[0003]在实现本专利技术的过程中,发现现有技术中至少存在以下技术问题:目前的血缘分析中仅对单个脚本进行分析,血缘分析存在脚本局限性。同时,在血缘分析过程中,由于脚本语句的多样性,存在解析器无法识别的字段内容,导致血缘分析的准确性差。

技术实现思路

[0004]本专利技术提供了一种脚本血缘解析方法、装置、存储介质、设备及产品,实现对多个脚本的血缘解析,并提高血缘解析的准确性。
[0005]根据本专利技术的一方面,提供了一种脚本血缘解析方法,包括:
[0006]获取待处理的多个脚本,对于每一所述脚本进行语句段的拆解,得到拆解的语句段;
[0007]对各所述语句段分别进行血缘解析,在解析过程中对于包括未识别字段的语句段,基于所述未识别字段对应的表信息在公共资产表中进行联动查询,得到所述表信息的查询结果,基于所述查询结果更新所述语句段,并基于所述更新后语句段得到对应的血缘解析结果;
[0008]基于各所述脚本中每一语句段的血缘解析结果,得到血缘数据。
[0009]可选的,在得到拆解的语句段之后,所述方法还包括:
[0010]在所述语句段包括变量的情况下,基于预配置的变量映射关系将所述变量更新为对应的变量值。
[0011]可选的,基于所述未识别字段对应的表信息在公共资产表中进行联动查询,得到所述表信息的查询结果,包括:
[0012]确定所述未识别字段对应表的表类型,基于所述表类型确定待查询的公共资产表,所述表类型包括临时表和目标表,所述临时表对应的公共资产表为脚本内公共表,所述目标表对应的公共资产表为脚本外的统一公共表;
[0013]将所述未识别字段对应的表信息在确定的所述公共资产表中进行联动查询,得到所述表信息的查询结果。
[0014]可选的,所述将所述未识别字段对应的表信息在确定的所述公共资产表中进行联动查询,得到所述表信息的查询结果,包括:
[0015]基于所述未识别字段对应表的表名、脚本所属物理子系统和库名中的一项或多项生成所述未识别字段对应表的唯一标识;
[0016]基于所述唯一标识在确定的所述公共资产表中进行联动查询,得到所述表信息的查询结果。
[0017]可选的,所述每一语句段的血缘解析结果包括:表和字段血缘关系。
[0018]可选的,所述基于各所述脚本中每一语句段的血缘解析结果,得到血缘数据,包括:
[0019]基于所述字段血缘关系,将所述表分别与上游表和下游表的至少一项进行建立关系,并去除重复表。
[0020]可选的,在将所述表分别与上游表和下游表的至少一项进行建立关系之前,所述方法还包括:
[0021]识别所述表的表类型,所述表类型包括临时表、目标表和常量表;
[0022]相应的,所述将所述表分别与上游表和下游表的至少一项进行建立关系,包括:
[0023]将所述临时表分别与同一脚本中的上游表和下游表简历关系,将所述目标表分别与任意脚本中的上游表和下游表建立关系;
[0024]将所述常量表与下游表建立关系。
[0025]可选的,所述基于各所述脚本中每一语句段的血缘解析结果,得到血缘数据,包括:
[0026]将各所述脚本中每一语句段的血缘解析结果输入至图数据库,基于所述图数据库得到血缘数据。
[0027]可选的,所述多个脚本来自于至少一个物理子系统;
[0028]在基于各所述脚本中每一语句段的血缘解析结果,得到血缘数据之前,还包括:将各所述语句段中解析得到的表名进行比对,对于表名相同,且所属物理子系统不同至少两个表,调节所述至少两个表中一项或多项所属的物理子系统,以统一所述至少两个表的唯一标识。
[0029]可选的,所述方法还包括:
[0030]对所述血缘数据中表进行循环判定,若所述血缘数据中包括循环表,则确定截断节点表,并基于所述截断节点表对所述血缘数据进行截断处理。
[0031]可选的,所述截断节点表为循环的至少一个表中的第一个重复表。
[0032]根据本专利技术的一方面,提供了一种脚本血缘解析装置,包括:
[0033]语句段拆解模块,用于获取待处理的多个脚本,对于每一所述脚本进行语句段的拆解,得到拆解的语句段;
[0034]语句段解析模块,用于对各所述语句段分别进行血缘解析,在解析过程中对于包括未识别字段的语句段,基于所述未识别字段对应的表信息在公共资产表中进行联动查询,得到所述表信息的查询结果,基于所述查询结果更新所述语句段,并基于所述更新后语句段得到对应的血缘解析结果;
[0035]血缘数据生成模块,用于基于各所述脚本中每一语句段的血缘解析结果,得到血缘数据。
[0036]根据本专利技术的另一方面,提供了一种电子设备,所述电子设备包括:
[0037]至少一个处理器;以及
[0038]与所述至少一个处理器通信连接的存储器;其中,
[0039]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的脚本血缘解析方法。
[0040]根据本专利技术的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的脚本血缘解析方法。
[0041]根据本专利技术的另一方面,提供了一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序在被处理器执行时实现本专利技术任一实施例所述的脚本血缘解析方法。
[0042]本专利技术实施例的技术方案,通过对多个脚本分别进行解析,并将各个脚本中语句段解析得到的血缘解析结果进行串联,得到多个脚本对应的血缘数据,实现了跨脚本的血缘分析。在对任一脚本中任一语句段的处理过程中,在存在未识别语句的情况下,通过预先设置的公共资产表进行联动查询,以实现对语句段的更新,避免血缘解析器无法识别的问题,提高了血缘解析的准确性。
[0043]应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0044]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种脚本血缘解析方法,其特征在于,包括:获取待处理的多个脚本,对于每一所述脚本进行语句段的拆解,得到拆解的语句段;对各所述语句段分别进行血缘解析:在解析过程中对于包括未识别字段的语句段,基于所述未识别字段对应的表信息在公共资产表中进行联动查询,得到所述表信息的查询结果,基于所述查询结果更新所述语句段,并基于更新后语句段得到对应的血缘解析结果;基于各所述脚本中每一语句段的血缘解析结果,得到血缘数据。2.根据权利要求1所述的方法,其特征在于,在得到拆解的语句段之后,所述方法还包括:在所述语句段包括变量的情况下,基于预配置的变量映射关系将所述变量更新为对应的变量值。3.根据权利要求1所述的方法,其特征在于,基于所述未识别字段对应的表信息在公共资产表中进行联动查询,得到所述表信息的查询结果,包括:确定所述未识别字段对应表的表类型,基于所述表类型确定待查询的公共资产表,所述表类型包括临时表和目标表,所述临时表对应的公共资产表为脚本内公共表,所述目标表对应的公共资产表为脚本外的统一公共表;将所述未识别字段对应的表信息在确定的所述公共资产表中进行联动查询,得到所述表信息的查询结果。4.根据权利要求3所述的方法,其特征在于,所述将所述未识别字段对应的表信息在确定的所述公共资产表中进行联动查询,得到所述表信息的查询结果,包括:基于所述未识别字段对应表的表名、脚本所属物理子系统和库名中的一项或多项生成所述未识别字段对应表的唯一标识;基于所述唯一标识在确定的所述公共资产表中进行联动查询,得到所述表信息的查询结果。5.根据权利要求1所述的方法,其特征在于,所述每一语句段的血缘解析结果包括:表和字段血缘关系。6.根据权利要求5所述的方法,其特征在于,所述基于各所述脚本中每一语句段的血缘解析结果,得到血缘数据,包括:基于所述字段血缘关系,将所述表分别与上游表和下游表的至少一项进行建立关系,并去除重复表。7.根据权利要求6所述的方法,其特征在于,在将所述表分别与上游表和下游表的至少一项进行建立关系之前,所述方法还包括:识别所述表的表类型,所述表类型包括临时表、目标表和常量表;相应的,所述将所述表分别与上游表和下游表的至少一项进行建立关系,包括:将所述临时表分别与同一脚本中的上游表和下游表简历关系,将所述目标表分别与任意脚本中的上游表和下游表建立关系;将所述常量表与下游表建立关...

【专利技术属性】
技术研发人员:谢呈文
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1