一种报表分析图自动生成及展示方法及系统技术方案

技术编号:28457035 阅读:16 留言:0更新日期:2021-05-15 21:21
本发明专利技术实施例提供一种报表分析图自动生成及展示方法,包括以下步骤:步骤一:从数据库提取数据;步骤二:将提取的数据进行清洗;步骤三:经过清洗之后的数据为异常数据时,提供风控警告,并将异常原因展示给用户;步骤四:经过清洗之后的数据为正常数据时,经过数据特征识别得到垃圾数据与核心数据;步骤五:分析核心数据并将分析结果进行展示,本发明专利技术实施例实现了数据可视化并且使得对数据进行自动分析以及对异常数据提供风控及警告提示。及对异常数据提供风控及警告提示。及对异常数据提供风控及警告提示。

【技术实现步骤摘要】
一种报表分析图自动生成及展示方法及系统


[0001]本专利技术涉及大数据
,更具体地说,涉及到一种报表分析图自动生成及展示方法及系统。

技术介绍

[0002]现有的数据可视化平台只是单纯的数据展示,没有起到数据分析的效果,从而导致数据库资源利用率低,同时也导致业务人员不能判断数据的价值。
[0003]本
技术实现思路

[0004]为了克服现有技术的不足,本专利技术提供一种报表分析图自动生成及展示方法用来如何解决现有技术无法对数据进行自动分析以及无法对异常数据提供风控及警告提示的问题。
[0005]本专利技术解决其技术问题所采用的技术方案是:提供一种报表分析图自动生成及展示方法,其特征在于,包括以下步骤:
[0006]步骤一:从数据库提取数据;
[0007]步骤二:将提取的数据进行清洗;
[0008]步骤三:经过清洗之后的数据为异常数据时,提供风控警告,并将异常原因展示给用户;
[0009]步骤四:经过清洗之后的数据为正常数据时,经过数据特征识别得到垃圾数据与核心数据;
[0010]步骤五:分析核心数据并将分析结果进行展示。
[0011]具体地,所述从数据库提取数据,所述步骤包括:
[0012]通过SQL语句从pandas库已封装的函数read_sql连接数据库中提取数据。
[0013]具体地,所述通过SQL语句从pandas库已封装的函数read_sql连接数据库中提取数据,所述步骤包括:
[0014]通过SQL语句从Python中pandas库已封装的函数read_sql连接数据库中选择提取的数据。
[0015]具体地,所述将提取的数据进行清洗,所述步骤包括:
[0016]从pandas库已封装的函数read_sql连接数据库中提取的数据进行清洗。
[0017]具体地,从pandas库已封装的函数read_sql连接数据库中提取的数据进行清洗,所述步骤包括:
[0018]对多个维度的数据进行整理、合并;
[0019]去除垃圾信息,优化排列核心信息。
[0020]具体地,所述经过清洗之后的数据为异常数据时,提供风控警告,并将异常原因展示给用户,所述步骤包括:
[0021]经过清洗之后的数据存在历史上没有出现过的字段、没有数据的字段以及缺少数据的字段;
[0022]通过自定义设置异常指标区分异常程度,并对突变的数据进行识别,提供风控警告,并将异常原因展示给用户。
[0023]具体地,所述经过清洗之后的数据为正常数据时,经过数据特征识别得到垃圾数据与核心数据,所述步骤包括:
[0024]经过清洗之后的数据为正常数据时,利用决策树算法生成随机森林,得出数据各个字段的重要等级;
[0025]去除等级较低的垃圾数据,保留核心数据。
[0026]具体地,分析核心数据,所述步骤包括:
[0027]把等级较高的字段进行单个维度的拓展;
[0028]将数据变化的关键区间趋势反馈至用户,并提示数据变化的关键区间趋势的重要程度。
[0029]具体地,分析核心数据并将分析结果进行展示,所述步骤包括:
[0030]将现有数据与历史数据进行对比,分析各维度的差异,得出数据演化的趋势,并反馈给用户;
[0031]或者
[0032]通过对关键数据进行识别,将关联性较高的字段组识别出来,并反馈给用户;
[0033]或者
[0034]将历史数据的所有关键字段输入决策树算法,生成随机森林,训练成一个预测模型;
[0035]利用预测模型预测当前的数据,并将预测的结果及概率展示出来。
[0036]具体地,其特征在于,分析核心数据并将分析结果进行展示,所述步骤包括:
[0037]利用python中的matplotlib画出统计图并进行展示,展示的方式包括柱状图、折线图、饼状图以及组合图。
[0038]一种报表分析图自动生成及展示系统,所述步骤包括:
[0039]数据提取单元,用于从数据库提取数据;
[0040]数据清洗单元,用于将提取的数据进行清洗;
[0041]数据第一判断单元,用于经过清洗之后的数据为异常数据时,提供风控警告,并将异常原因展示给用户;
[0042]数据第二判断单元,用于经过清洗之后的数据为正常数据时,经过数据特征识别得到垃圾数据与核心数据;
[0043]数据分析展示单元,用于分析核心数据并将分析结果进行展示。
[0044]本专利技术的有益效果是:通过步骤一:从数据库提取数据;步骤二:将提取的数据进行清洗;步骤三:经过清洗之后的数据为异常数据时,提供风控警告,并将异常原因展示给用户;步骤四:经过清洗之后的数据为正常数据时,经过数据特征识别得到垃圾数据与核心数据;步骤五:分析核心数据并将分析结果进行展示,从而实现了数据可视化并且使得对数据进行自动分析以及对异常数据提供风控及警告提示。
附图说明
[0045]图1是一种报表分析图自动生成及展示方法的流程示意图。
[0046]图2是一种报表分析图自动生成及展示系统的功能模块图。
[0047]图3是一种报表分析图自动生成及展示方法的另一流程示意图。
具体实施方式
[0048]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0049]以下结合具体实施例对本专利技术的具体实现进行详细描述:
[0050]实施例一:
[0051]图1示出了本专利技术实施例一提供的一种报表分析图自动生成及展示方法的实现流程,为了便于说明,仅示出了与本专利技术实施例相关的部分,详述如下:
[0052]在步骤S101中,从数据库提取数据;
[0053]具体地,所述从数据库提取数据,所述步骤包括:
[0054]通过SQL语句从pandas库已封装的函数read_sql连接数据库中提取数据。
[0055]具体地,所述通过SQL语句从pandas库已封装的函数read_sql连接数据库中提取数据,所述步骤包括:
[0056]通过SQL语句从Python中pandas库已封装的函数read_sql连接数据库中选择提取的数据。
[0057]在步骤S102中,将提取的数据进行清洗;
[0058]具体地,所述将提取的数据进行清洗,所述步骤包括:
[0059]从pandas库已封装的函数read_sql连接数据库中提取的数据进行清洗。
[0060]具体地,从pandas库已封装的函数read_sql连接数据库中提取的数据进行清洗,所述步骤包括:
[0061]对多个维度的数据进行整理、合并;
[0062]去除垃圾信息,优化排列核心信息。
[0063]在步骤S103中,经过清洗之后的数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种报表分析图自动生成及展示方法,其特征在于,包括以下步骤:步骤一:从数据库提取数据;步骤二:将提取的数据进行清洗;步骤三:经过清洗之后的数据为异常数据时,提供风控警告,并将异常原因展示给用户;步骤四:经过清洗之后的数据为正常数据时,经过数据特征识别得到垃圾数据与核心数据;步骤五:分析核心数据并将分析结果进行展示。2.根据权利要求1所述的一种报表分析图自动生成及展示方法,其特征在于,所述从数据库提取数据,所述步骤包括:通过SQL语句从pandas库已封装的函数read_sql连接数据库中提取数据。3.根据权利要求2所述的一种报表分析图自动生成及展示方法,其特征在于,所述通过SQL语句从pandas库已封装的函数read_sql连接数据库中提取数据,所述步骤包括:通过SQL语句从Python中pandas库已封装的函数read_sql连接数据库中选择提取的数据。4.根据权利要求3所述的一种报表分析图自动生成及展示方法,其特征在于,所述将提取的数据进行清洗,所述步骤包括:从pandas库已封装的函数read_sql连接数据库中提取的数据进行清洗。5.根据权利要求4所述的一种报表分析图自动生成及展示方法,其特征在于,从pandas库已封装的函数read_sql连接数据库中提取的数据进行清洗,所述步骤包括:对多个维度的数据进行整理、合并;去除垃圾信息,优化排列核心信息。6.根据权利要求5所述的一种报表分析图自动生成及展示方法,其特征在于,所述经过清洗之后的数据为异常数据时,提供风控警告,并将异常原因展示给用户,所述步骤包括:经过清洗之后的数据存在历史上没有出现过的字段、没有数据的字段以及缺少数据的字段;通过自定义设置异常指标区分异常程度,并对突变的数据进行识别,提供风控警告,并将异常原因展示给用户。7.根...

【专利技术属性】
技术研发人员:苟成职
申请(专利权)人:银盛通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1