一种报表的生成方法及装置制造方法及图纸

技术编号:23984652 阅读:25 留言:0更新日期:2020-04-29 12:56
本申请提供了一种报表的生成方法及装置,其中,该方法包括:获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法,对该文件类型下目标数据进行取数处理,得到第一目标语句;确定该第一目标语句中属于预设目标种类下的词汇;最后,基于各个第一目标语句中属于预设目标种类下的词汇,构建报表;在该过程中,由于能够基于文件类型,确定所述文件类型下目标数据的取数方法,并所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇,从而构建报表,减少了人工操作,节省时间和资源,提高了生成数据分析报表的效率。

A method and device for generating report forms

【技术实现步骤摘要】
一种报表的生成方法及装置
本申请涉及大数据领域,尤其是涉及一种报表的生成方法及装置。
技术介绍
随着信息技术的高速发展,大数据时代逐渐来临,且其数据源具有多样性。为了充分体现数据的价值,可以将数据整合为数据分析报表,以便于后续的使用。现有技术中,通常需要人工逐一地获取数据,并按照数据固有的属性,将获取到的数据整合成相应的数据分析报表,再按照报表的结构进行相应的调整,由此,需要消耗较多的时间与人工,生成数据分析报表的效率不佳。
技术实现思路
有鉴于此,本申请的目的在于提供一种报表的生成方法及装置,以提高生成数据分析报表的效率。第一方面,本申请实施例提供了一种报表的生成方法,包括:获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法;基于该文件类型下目标数据的取数方法,对该文件类型下目标数据进行取数处理,得到第一目标语句;基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇;基于各个第一目标语句中属于预设目标种类下的词汇,构建报表;所述报表包括:所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇。一种可选实施方式中,所述文件类型包括以下任意一种:HIVE文件、Hbase文件、Greenplum文件、PostgreSQL文件,以及Elasticsearch文件、webmagic文件。一种可选实施方式中,所述对于每一种文件类型,确定该文件类型下目标数据的取数方法,包括:针对HIVE文件、Hbase文件、Greenplum文件、PostgreSQL文件中的目标数据,利用结构化查询SQL语句作为所述取数方法,得到所述第一目标语句;和/或,针对Elasticsearch文件、webmagic文件中的目标数据,利用超文本传输协议HTTP请求作为所述取数方法,得到所述第一目标语句。一种可选实施方式中,所述预设目标种类包括以下至少一种:时间、数量、物品名称、品牌、年龄、性别。一种可选实施方式中,在所述基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇之后,还包括:针对该第一目标语句中除属于预设目标种类下的词汇之外的词汇,进行删除处理。一种可选实施方式中,在基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇之后,还包括:基于该第一目标语句,将属于预设目标种类的词汇用变量进行替换,得到该第一目标语句对应的第二目标语句。一种可选实施方式中,在基于该第一目标语句,将属于预设目标种类的词汇用变量进行替换,得到该第一目标语句对应的第二目标语句之后,还包括:基于各个第二目标语句的顺序,对各第二目标语句进行编号;各个第二目标语句的顺序,与所述报表中属于预设目标种类的词汇顺序相对应;基于各个第二目标语句的文件类型及取数方法,对各第二目标语句添加标识;所述标识为各个第二目标语句对应的取数方法。第二方面,本申请实施例还提供一种报表的生成装置,该报表的生成装置包括:获取模块、处理模块、确定模块以及构建模块,其中:所述获取模块,用于获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法;所述处理模块,用于基于该文件类型下目标数据的取数方法,对该文件类型下目标数据进行取数处理,得到第一目标语句;所述确定模块,用于基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇;所述构建模块,用于基于各个第一目标语句中属于预设目标种类下的词汇,构建报表;所述报表包括:所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇。一种可选实施方式中,所述文件类型包括以下任意一种:HIVE文件、Hbase文件、Greenplum文件、PostgreSQL文件,以及Elasticsearch文件、webmagic文件。一种可选实施方式中,所述获取模块,用于获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法时,具体用于:针对HIVE文件、Hbase文件、Greenplum文件、PostgreSQL文件中的目标数据,利用结构化查询SQL语句作为所述取数方法,得到所述第一目标语句;和/或,针对Elasticsearch文件、webmagic文件中的目标数据,利用超文本传输协议HTTP请求作为所述取数方法,得到所述第一目标语句。一种可选实施方式中,所述预设目标种类包括以下至少一种:时间、数量、物品名称、品牌、年龄、性别。一种可选实施方式中,在所述确定模块,用于基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇之后,还用于:针对该第一目标语句中除属于预设目标种类下的词汇之外的词汇,进行删除处理。一种可选实施方式中,在所述确定模块,用于基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇之后,还包括:替换模块,其中:所述替换模块,用于基于该第一目标语句,将属于预设目标种类的词汇用变量进行替换,得到该第一目标语句对应的第二目标语句。一种可选实施方式中,在替换模块,用于基于所述第一目标语句,将属于预设目标种类的可替换词汇用变量进行替换,得到第二目标语句之后,还用于:基于各个第二目标语句的顺序,对各第二目标语句进行编号;各个第二目标语句的顺序,与所述报表中属于预设目标种类的词汇顺序相对应;基于各个第二目标语句的文件类型及取数方法,对各第二目标语句添加标识;所述标识为各个第二目标语句对应的取数方法。第三方面,本申请实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面、或第一方面中任一种可能的实施方式中的步骤。第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面、或第一方面中任一种可能的实施方式中的步骤。本申请实施例提供的一种报表的生成方法及装置,首先,获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法;之后,基于该文件类型下目标数据的取数方法,对该文件类型下目标数据进行取数处理,得到第一目标语句;并基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇;最后,基于各个第一目标语句中属于预设目标种类下的词汇,构建报表;所述报表包括:所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇。在该过程中,由于能够基于文件类型,确定所述文件类型下目标数据的取数方法,并所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇,从而构建报表,减少了人工操作,节省时间本文档来自技高网...

【技术保护点】
1.一种报表的生成方法,其特征在于,包括:/n获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法;/n基于该文件类型下目标数据的取数方法,对该文件类型下目标数据进行取数处理,得到第一目标语句;/n基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇;/n基于各个第一目标语句中属于预设目标种类下的词汇,构建报表;所述报表包括:所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇。/n

【技术特征摘要】
1.一种报表的生成方法,其特征在于,包括:
获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法;
基于该文件类型下目标数据的取数方法,对该文件类型下目标数据进行取数处理,得到第一目标语句;
基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇;
基于各个第一目标语句中属于预设目标种类下的词汇,构建报表;所述报表包括:所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇。


2.根据权利要求1所述的方法,其特征在于,所述文件类型包括以下任意一种:
HIVE文件、Hbase文件、Greenplum文件、PostgreSQL文件,以及Elasticsearch文件、webmagic文件。


3.根据权利要求1所述的方法,其特征在于,所述对于每一种文件类型,确定该文件类型下目标数据的取数方法,包括:
针对HIVE文件、Hbase文件、Greenplum文件、PostgreSQL文件中的目标数据,利用结构化查询SQL语句作为所述取数方法,得到所述第一目标语句;
和/或,
针对Elasticsearch文件、webmagic文件中的目标数据,利用超文本传输协议HTTP请求作为所述取数方法,得到所述第一目标语句。


4.根据权利要求1所述的方法,其特征在于,所述预设目标种类包括以下至少一种:
时间、数量、物品名称、品牌、年龄、性别。


5.根据权利要求1所述的方法,其特征在于,在所述基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇之后,还包括:
针对该第一目标语句中除属于预设目标种类下的词汇之外的词汇,进行删除处理。


6.根据权利要求1所述的方...

【专利技术属性】
技术研发人员:田少龙
申请(专利权)人:恩亿科北京数据科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1