元数据分析方法及装置制造方法及图纸

技术编号:33152458 阅读:22 留言:0更新日期:2022-04-22 14:07
本发明专利技术提供一种元数据分析方法及装置,属于金融技术领域或其他技术领域。该元数据分析方法包括:根据预设的表名称列表从脚本的结构化查询语言中筛选有效结构化查询语言;对有效结构化查询语言进行分词处理得到有效词语,根据有效词语与表名称列表的匹配结果确定匹配范围;将匹配范围中的有效词语与预设的关键词进行匹配得到源表数据和目标表数据。本发明专利技术可以快速检索到有效的元数据信息,提高元数据分析的通用性。析的通用性。析的通用性。

【技术实现步骤摘要】
元数据分析方法及装置


[0001]本专利技术涉及金融
,具体地,涉及一种元数据分析方法及装置。

技术介绍

[0002]当前对于SQL语法分析有很多工具,比如基于java开发的ANTLR,apache旗下的druid和基于C语言开发的lex和yacc等。这类工具的核心思想是根据SQL(Structured Query Lan guage,结构化查询语言)语法特性的进行分词,再根据语法规则进行语义分析,之后统计出对应语句的基本逻辑,进行元数据分析。这些已有的工具能解决一些常见的统计需求,但是对于一些特定的场景,也存在一定弊端:
[0003]1.已有分析工具只针对SQL结构的语法才能进行分析,但是通常企业中的SQL是依托于一个完整的脚本来实现的,其中不止包含SQL语句。在这种场景下,单纯的去解析SQL语法显然是无法做到的。
[0004]2.SQL语法针对不同数据库的语义有很大差异,很难做到一个工具能兼顾到市面主流数据库语法的情况,遇到无法解析的语法,程序会直接退出或报异常导致分析失败。
[0005]3.自动化功能需要额外本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种元数据分析方法,其特征在于,包括:根据预设的表名称列表从脚本的结构化查询语言中筛选有效结构化查询语言;对所述有效结构化查询语言进行分词处理得到有效词语,根据所述有效词语与所述表名称列表的匹配结果确定匹配范围;将所述匹配范围中的有效词语与预设的关键词进行匹配得到源表数据和目标表数据。2.根据权利要求1所述的元数据分析方法,其特征在于,还包括:根据所述源表数据、所述目标表数据和所述脚本生成表流向数据。3.根据权利要求1所述的元数据分析方法,其特征在于,还包括:根据有效词语与预设的关键词的匹配结果确定未匹配有效结构化查询语言;根据预设的表语法格式从所述未匹配有效结构化查询语言中获取源表数据和目标表数据。4.根据权利要求3所述的元数据分析方法,其特征在于,根据有效词语与预设的关键词的匹配结果确定未匹配有效结构化查询语言包括:根据有效词语与预设的关键词的匹配结果确定未匹配有效词语;确定所述未匹配有效词语对应的未匹配有效结构化查询语言。5.根据权利要求2所述的元数据分析方法,其特征在于,还包括:根据标注表数据对所述源表数据和所述目标表数据进行聚类处理,得到表业务种类;根据所述表业务种类、所述源表数据、所述目标表数据和所述表流向数据生成元数据分析结果。6.根据权利要求5所述的元数据分析方法,其特征在于,根据所述标注表数据对所述源表数据和所述目标表数据进行聚类处理,得到表业务种类包括:...

【专利技术属性】
技术研发人员:解春磊尚磊刘敏郭凌云
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1