当前位置: 首页 > 专利查询>徐婷专利>正文

一种基于自动化SQL编写的数据指标查询模型制造技术

技术编号:33542720 阅读:40 留言:0更新日期:2022-05-21 09:54
本发明专利技术提供一种基于自动化SQL编写的数据指标查询模型,包括:在数据仓库按照不同主题建设主题指标层,不同主题指标层通过唯一标识切入建立指标体系;对指标体系中不同主题指标层的数据指标进行配置;根据指标体系以及配置的数据指标完成用户需求输入;根据用户需求输入自动生成查询SQL脚本,并返回查询结果。本发明专利技术通过模型实现自动化SQL语言编写,实现明细、汇总等查询,简化业务需求到查询结果之间的流程,通过数据指标配置和查询模型算法,实现由机器代替人工的方式,自动生成符合业务需求的查询结果。查询结果。查询结果。

【技术实现步骤摘要】
一种基于自动化SQL编写的数据指标查询模型


[0001]本专利技术涉及数据分析
,具体而言,涉及一种基于自动化SQL编写的数据指标查询模型。

技术介绍

[0002]目前用户对数据分析的需求越来越多,为了让用户能快速、准确和直观的获取业务数据,进行数据分析,目前主要采用四种方式:一是通过技术人员对接业务需求进行数据提取;二是技术人员通过业务需求开发固化报表;三是技术人员预先建立基于维度指标表和度量指标表的CUBE数据集,由业务人员进行自助分析;四是建立数据指标宽表,由业务人员进行自助筛选查询分析;以上四种方式主要存在以下问题:
[0003]1、第一种方式需要给业务人员配备对应的技术开发人员辅助进行数据提取,沟通成本和人员成本较高。
[0004]2、第二种或第三种方式,当有报表或数据集需求变更时,需要重构原有报表或CUBE数据集,造成数据开发工作增加且容易造成数据指标口径不统一。
[0005]3、不同报表和CUBE数据集之间的指标不能关联使用,业务人员需要导出报表通过外部工具(如EXCEL)进行关联或由技术人员进行协助处理,造成因数据导出的数据安全问题以及工作效率降低。
[0006]4、目前基于CUBE数据集的数据查询分析工具的界面操作更符合技术人员思维,造成业务人员不易于理解,学习成本较高,甚至需要配备专门的技术人员进行数据预处理的支持,造成人员成本增加。
[0007]5、第四种基于宽表的指标模型设计,所有指标均需要预先加工进宽表,数据指标开发不灵活,占用较多的数据存储,在需要进行历史数据重跑时跑批效率较低,且容易对其他指标造成影响。

技术实现思路

[0008]本专利技术旨在提供一种基于自动化SQL编写的数据指标查询模型,从开发和业务两个角度出发,以提高工作效率为目标:
[0009](1)开发角度,避免不必要的重复指标开发工作,降低每个指标之间的耦合度,实现灵活高效的指标开发;同时避免因开发人员业务理解的不同造成的数据查询不统一问题。
[0010](2)业务角度,采用低代码的方式,打破业务人员与后台数据指标提取的技术壁垒,通过自动化编写SQL,实现业务需求输入到后台指标查询的自动化实现,实现业务人员自助进行数据指标查询分析,提高数据查询工作效率以及质量。
[0011]本专利技术提供的一种基于自动化SQL编写的数据指标查询模型,包括如下步骤:
[0012]在数据仓库按照不同主题建设主题指标层,不同主题指标层通过唯一标识切入建立指标体系;
[0013]对指标体系中不同主题指标层的数据指标进行配置;
[0014]根据指标体系以及配置的数据指标完成用户需求输入;
[0015]根据用户需求输入自动生成查询SQL脚本,并返回查询结果。
[0016]进一步的,每个所述主题指标层的数据表结构由开发人员根据指标类型以及数据量确定采用相应数据表结构中合适的存储方式。
[0017]进一步的,所述数据表结构包括:
[0018](1)基础信息表:每个主题只有一个基础信息表,该基础信息表作为查询时的主表,表结构包含主题ID唯一主键列,通过该唯一主键列与其他数据表关联;
[0019](2)基础指标表:每个主题有一个或多个基础指标表,用于存储不因时间变化的数据指标;所述基础指标表的存储方式包括:
[0020]列式存储方式,表结构为:主题ID、指标存储ID、指标值;
[0021]行式存储方式,表结构为:主题ID、指标列1、指标列2、指标列3...指标列N;
[0022](3)时间指标表:每个主题有一个或多个时间指标表,用于存储随时间经常变化的数据指标;所述时间指标表中的数据指标按日期存储,包括如下两种存储方式:
[0023]列式存储方式,表结构为:日期、主题ID、指标存储ID、指标值;
[0024]行式存储方式,表结构为:日期、主题ID、指标列1、指标列2、指标列3...指标列N;
[0025](4)拉链指标表:每个主题有一个或多个拉链指标表,用于存储随时间偶尔变化的数据指标;所述拉链指标表的存储方式包括:
[0026]列式存储方式,表结构为:开始日期、结束日期、主题ID、指标存储ID、指标值;
[0027]行式存储方式,表结构为:开始日期、结束日期、主题ID,指标列1、指标列2、指标列3...指标列N;
[0028](5)多维明细表:用于明细查询以及分组汇总作为查询子表使用,表结构为:主题ID;维度1,维度2...维度N;指标值1,指标值2...指标值N;
[0029](6)时间多维明细表:用于明细查询以及分组汇总作为查询子表使用,表结构为:时间,主题ID;维度1,维度2...维度N;指标值1,指标值2...指标值N。
[0030]作为优选,在存储数据时对于部分为缺省值的数据不导入数据表。
[0031]进一步的,所述对指标体系中不同主题指标层的数据指标进行配置的配置项包括:
[0032](1)指标ID,数据指标的唯一标识,相当于指标编号;
[0033](2)主题ID,定义数据指标属于哪个主题;
[0034](3)数据类型;
[0035](4)单位,列出指标业务可快速设置的单位处理;
[0036](5)指标枚举参数,设置需要筛选的维度值;
[0037](6)数据模型,用于快速设置查询数据指标的衍生指标;
[0038](7)运算符,列出指标业务可用于数据指标的指标值筛选计算的运算;
[0039](8)指标存储ID,用于自动化SQL编写模型使用;
[0040](9)关联表类型,用于自动化SQL编写模型使用;
[0041](10)关联表名,用于自动化SQL编写模型使用;
[0042](11)关联列名,用于自动化SQL编写模型使用;
[0043](12)排序类型,列出指标业务是否可用于进行排序设置。
[0044]进一步的,所述用户需求输入包括明细数据查询需求输入和汇总统计分析查询需求输入。
[0045]进一步的,所述明细数据查询需求输入的方法包括:
[0046]用户按权限在数据指标树中按照自己需求选择数据指标;
[0047]用户根据需求以及所选数据指标特性,按照数据指标的配置或自定义设置数据指标的各项参数以及筛选条件;
[0048]根据筛选条件自由组合条件逻辑;
[0049]完成明细数据查询需求输入。
[0050]进一步的,所述汇总统计分析查询需求输入的方法包括:在明细查询结果的基础上,通过设置分组指标和统计指标进行汇总查询。
[0051]进一步的,当所述用户需求输入为明细数据查询需求输入时,所述根据用户需求输入自动生成查询SQL脚本,并返回查询结果的方法包括:
[0052](1)添加基础信息表查询脚本;
[0053](2)解析用户设置的数据指标的各项参数:根据关联表名、关联表列名、关联表本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自动化SQL编写的数据指标查询模型,其特征在于,包括如下步骤:在数据仓库按照不同主题建设主题指标层,不同主题指标层通过唯一标识切入建立指标体系;对指标体系中不同主题指标层的数据指标进行配置;根据指标体系以及配置的数据指标完成用户需求输入;根据用户需求输入自动生成查询SQL脚本,并返回查询结果。2.根据权利要求1所述的基于自动化SQL编写的数据指标查询模型,其特征在于,每个所述主题指标层的数据表结构由开发人员根据指标类型以及数据量确定采用相应数据表结构中合适的存储方式。3.根据权利要求2所述的基于自动化SQL编写的数据指标查询模型,其特征在于,所述数据表结构包括:(1)基础信息表:每个主题只有一个基础信息表,该基础信息表作为查询时的主表,表结构包含主题ID唯一主键列,通过该唯一主键列与其他数据表关联;(2)基础指标表:每个主题有一个或多个基础指标表,用于存储不因时间变化的数据指标;所述基础指标表的存储方式包括:列式存储方式,表结构为:主题ID、指标存储ID、指标值;行式存储方式,表结构为:主题ID、指标列1、指标列2、指标列3...指标列N;(3)时间指标表:每个主题有一个或多个时间指标表,用于存储随时间经常变化的数据指标;所述时间指标表中的数据指标按日期存储,包括如下两种存储方式:列式存储方式,表结构为:日期、主题ID、指标存储ID、指标值;行式存储方式,表结构为:日期、主题ID、指标列1、指标列2、指标列3...指标列N;(4)拉链指标表:每个主题有一个或多个拉链指标表,用于存储随时间偶尔变化的数据指标;所述拉链指标表的存储方式包括:列式存储方式,表结构为:开始日期、结束日期、主题ID、指标存储ID、指标值;行式存储方式,表结构为:开始日期、结束日期、主题ID,指标列1、指标列2、指标列3...指标列N;(5)多维明细表:用于明细查询以及分组汇总作为查询子表使用,表结构为:主题ID;维度1,维度2...维度N;指标值1,指标值2...指标值N;(6)时间多维明细表:用于明细查询以及分组汇总作为查询子表使用,表结构为:时间,主题ID;维度1,维度2...维度N;指标值1,指标值2...指标值N。4.根据权利要求2或3所述的基于自动化SQL编写的数据指标查询模型,其特征在于,在存储数据时对于部分为缺省值的数据不导入数据表。5.根据权利要求3所述的基于自动化SQL编写的数据指标查询模型,其特征在于,所述对指标体系中不同主题指标层的数据指标进行配置的配置项包括:(1)指标ID,数据指标的唯一标识,相当于指标编号;(2)主题ID,定义数据指标属于哪个主题;(3)数据类型;(4)单位,列出指标业务可快速设置的单位处理;(5)指标枚举参数,设置需要筛选的维度值;
(6)数据模型,用于快速设置查询数据指标的衍生指标;(7)运算符,列出指标业务可用于数据指标的指标值筛选计算的运算;(8)指标存储ID,用于自动化SQL编写模型使用;(9)关联表类型,用于自动化SQL编写模型使用;(10)关联表名,用于自...

【专利技术属性】
技术研发人员:徐婷
申请(专利权)人:徐婷
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1