一种自动分析指标口径的方法、系统和装置制造方法及图纸

技术编号:25479433 阅读:36 留言:0更新日期:2020-09-01 23:00
本发明专利技术公开了一种自动分析指标口径的方法、系统和装置,属于大数据处理领域;所述的方法先按照S1获取指标执行逻辑,通过S2对S1获取的执行逻辑进行循环判断、分析生成sql组,按照S3对sql组进行递归分析,首先分析第一层,获取sql的条件部分where和数据来源部分from,通过S4对sql的条件部分进行解析,获取单个条件的组W,对sql的数据来源from部分进行解析,获得单个表的组B,S5对组W进行循环分析,得到每个条件的字段信息及其其中的关联关系,在通过S6将分析结果进行汇总,并存储为结构化数据,最后按照S7通过画图插件D3将分析等到的数据图形化的展示在页面上,供客户查看指标口径。

【技术实现步骤摘要】
一种自动分析指标口径的方法、系统和装置
本专利技术公开一种自动分析指标口径的方法、系统和装置,涉及大数据处理

技术介绍
大数据分析是指对规模巨大的数据进行分析。大数据可以概括为5个V,数据量大(Volume)、速度快(Velocity)、类型多(Variety)、价值(Value)、真实性(Veracity)。大数据作为时下最火热的IT行业的词汇,随之而来的数据仓库、数据安全、数据分析、数据挖掘等等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。随着大数据时代的来临,大数据分析也应运而生;统计口径是指统计数据所采用的标准,即进行数据的统计工作所依照的指标体系,统计口径包括统计方式、统计范围等指标;对于指标口径来说,目前都是通过人工配置实现,没有一种自动解析的方法去自动解析,使用者无法直观观察到指标口径及其内在关系,工作效率较低,故现专利技术一种自动分析指标口径的方法、系统和装置,已解决上述问题。
技术实现思路
本专利技术针对现有技术的问题,提供一种自动分析指标口径的方法、系统和装置,所采用的技术方案为:一种自动分析指标口径的方法,所述的方法具体步骤如下:S1获取指标执行逻辑;S2对执行逻辑循环判断分析生成sql组;S3对sql组进行递归分析,获取sql组的条件部分where和数据来源部分from;S4对where部分解析获取单个条件的组W,对from部分解析获得单个表的组B;S5对组W进行循环分析,得到每个条件的字段信息及其其中的关联关系;S6将分析结果进行汇总,并存储为结构化数据;S7利用画图插件D3将分析得到的数据进行图像化展示,供客户查看指标口径。所述S2对执行逻辑循环判断分析生成sql组的具体步骤包括:S201判断执行逻辑是否为存储过程;S202是,则将执行逻辑记为Sql1;S212否,则解析出其中的相关插入sql,记为Sql1、Sql2......Sqln;S203将Sql1、Sql2......Sqln组成sql组进行循环分析。所述S5对组W进行循环分析,得到每个条件的字段信息及其其中的关联关系的具体步骤包括;S501将得到为1个字段Z1的条件从组B中找到对应的表Bn,S511将得到为n个字段Z1…Zn的条件从组B中找到对应的表B1...Bn,并对其记进行去重,得到B1…Bm(m<=n);S502利用递归临时表LBn从数据库中找到字段来源的真实物理表;S503利用真实物理表得到相应的口径,并递归分析临时表LBn的所有口径。所述S511将得到为n个字段Z1…Zn的条件从组B中找到对应的表B1...Bn,并对其记进行去重,得到B1…Bm(m<=n)的具体步骤包括:S521当组B中表B1…Bm中的m等于1,对Z1…Zn进行循环,每个字段按照S501进行分析;S531当组B中表B1…Bm中的m>1,对字段Z1…Zn分别按照S501进行处理汇总,得到B1…Bm的一个关联口径。所述S7利用画图插件D3将分析得到的数据进行图像化展示,其展示把表显示为节点,通过连线展示表与表之间的关系,其具体步骤包括:S701表独有的口径,直接显示在表的详细信息中;S711表和表的关联口径,则直接显示的表与表之间的连线上。一种自动分析指标口径的系统,所述的系统包括获取模块、判断生成模块、递归分析模块、分步解析模块、字段关联模块、汇总存储模块和图像展示模块;获取模块获取指标执行逻辑;判断生成模块对执行逻辑循环判断分析生成sql组;递归分析模块对sql组进行递归分析,获取sql组的条件部分where和数据来源部分from;分步解析模块对where部分解析获取单个条件的组W,对from部分解析获得单个表的组B;字段关联模块对组W进行循环分析,得到每个条件的字段信息及其其中的关联关系;汇总存储模块将分析结果进行汇总,并存储为结构化数据;图像展示模块利用画图插件D3将分析得到的数据进行图像化展示,供客户查看指标口径。所述判断生成模块还包括逻辑判断模块、第一标记模块、第二标记模块和循环分析模块:逻辑判断模块:判断执行逻辑是否为存储过程;第一标记模块:逻辑判断模块判断为是时,将执行逻辑记为Sql1;第二标记模块:逻辑判断模块判断为否时,解析出其中的相关插入sql,记为Sql1、Sql2......Sqln;循环分析模块:将Sql1、Sql2......Sqln组成sql组进行循环分析。所述字段关联模块还包括单字段模块、多字段模块、来源分析模块和口径分析模块;单字段模块:将得到为1个字段Z1的条件从组B中找到对应的表Bn,多字段模块:将得到为n个字段Z1…Zn的条件从组B中找到对应的表B1...Bn,并对其记进行去重,得到B1…Bm(m<=n);来源分析模块:利用递归临时表LBn从数据库中找到字段来源的真实物理表;口径分析模块:利用真实物理表得到相应的口径,并递归分析临时表LBn的所有口径。所述多字段模块还包括分类循环模块A和分类循环模块B;当组B中表B1…Bm中的m等于1,分类循环模块A对Z1…Zn进行循环,每个字段按照单字段模块进行分析当组B中表B1…Bm中的m>1,分类循环模块B对字段Z1…Zn分别按照单子弹模块进行处理汇总,得到B1…Bm的一个关联口径。一种自动分析指标口径装置,包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现如权利要求1-4任一项所述的自动分析指标口径的方法。本专利技术的有益效果为:本专利技术方法先按照S1获取指标执行逻辑,通过S2对S1获取的执行逻辑进行循环判断、分析生成sql组,按照S3对sql组进行递归分析,首先分析第一层,获取sql的条件部分where和数据来源部分from,通过S4对sql的条件部分进行解析,获取单个条件的组W,对sql的数据来源from部分进行解析,获得单个表的组B,S5对组W进行循环分析,得到每个条件的字段信息及其其中的关联关系,在通过S6将分析结果进行汇总,并存储为结构化数据,最后按照S7通过画图插件D3将分析等到的数据图形化的展示在页面上,供客户查看指标口径;解决自动分析指标sql获取指标口径的问题的同时,能够图形化展示指标口径及其内在关系,节省人力资源的使用,提高数据分析指标口径的工作效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术方法的流程示意图;图2是本专利技术本文档来自技高网...

【技术保护点】
1.一种自动分析指标口径的方法,其特征是所述的方法具体步骤如下:/nS1获取指标执行逻辑;/nS2对执行逻辑循环判断分析生成sql组;/nS3对sql组进行递归分析,获取sql组的条件部分where和数据来源部分from;/nS4对where部分解析获取单个条件的组W,对from部分解析获得单个表的组B;/nS5对组W进行循环分析,得到每个条件的字段信息及其其中的关联关系;/nS6将分析结果进行汇总,并存储为结构化数据;/nS7利用画图插件D3将分析得到的数据进行图像化展示,供客户查看指标口径。/n

【技术特征摘要】
1.一种自动分析指标口径的方法,其特征是所述的方法具体步骤如下:
S1获取指标执行逻辑;
S2对执行逻辑循环判断分析生成sql组;
S3对sql组进行递归分析,获取sql组的条件部分where和数据来源部分from;
S4对where部分解析获取单个条件的组W,对from部分解析获得单个表的组B;
S5对组W进行循环分析,得到每个条件的字段信息及其其中的关联关系;
S6将分析结果进行汇总,并存储为结构化数据;
S7利用画图插件D3将分析得到的数据进行图像化展示,供客户查看指标口径。


2.根据权利要求1所述的自动分析指标口径的方法,其特征是所述S2对执行逻辑循环判断分析生成sql组的具体步骤包括:
S201判断执行逻辑是否为存储过程;
S202是,则将执行逻辑记为Sql1;
S212否,则解析出其中的相关插入sql,记为Sql1、Sql2......Sqln;
S203将Sql1、Sql2......Sqln组成sql组进行循环分析。


3.根据权利要求1所述的自动分析指标口径的方法,其特征是所述S5对组W进行循环分析,得到每个条件的字段信息及其其中的关联关系的具体步骤包括;
S501将得到为1个字段Z1的条件从组B中找到对应的表Bn,
S511将得到为n个字段Z1…Zn的条件从组B中找到对应的表B1...Bn,并对其记进行去重,得到B1…Bm(m<=n);
S502利用递归临时表LBn从数据库中找到字段来源的真实物理表;
S503利用真实物理表得到相应的口径,并递归分析临时表LBn的所有口径。


4.根据权利要求3所述的自动分析指标口径的方法,其特征是所述S511将得到为n个字段Z1…Zn的条件从组B中找到对应的表B1...Bn,并对其记进行去重,得到B1…Bm(m<=n)的具体步骤包括:
S521当组B中表B1…Bm中的m等于1,对Z1…Zn进行循环,每个字段按照S501进行分析;
S531当组B中表B1…Bm中的m>1,对字段Z1…Zn分别按照S501进行处理汇总,得到B1…Bm的一个关联口径。


5.根据权利要求1-4任一所述的自动分析指标口径的方法,其特征是所述S7利用画图插件D3将分析得到的数据进行图像化展示,其展示把表显示为节点,通过连线展示表与表之间的关系,其具体步骤包括:
S701表独有的口径,直接显示在表的详细信息中;
S711表和表的关联口径,则直接显示的表与表之间的连线上。


6....

【专利技术属性】
技术研发人员:肖庆超程林杨培强
申请(专利权)人:山东浪潮商用系统有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1