数据统计方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:20025684 阅读:42 留言:0更新日期:2019-01-06 04:32
本发明专利技术公开了一种数据统计方法,该方法包括:获取待统计的原始数据流;根据所述原始数据流调用并解析预设的数据统计配置文件,得到预设类型的待生成统计报表的预处理类信息和统计条件信息;根据所述预处理类信息对所述原始数据流进行预处理,得到对应的统计元数据;根据所述统计条件信息对所述统计元数据进行统计,根据统计结果生成对应的统计报表。本发明专利技术还公开了一种数据统计装置、设备和一种计算机可读存储介质。本发明专利技术能够提高基于Spark平台进行数据统计的代码灵活性,降低代码的开发维护成本。

【技术实现步骤摘要】
数据统计方法、装置、设备及计算机可读存储介质
本专利技术涉及大数据处理
,尤其涉及数据统计方法、装置、设备及计算机可读存储介质。
技术介绍
Spark是一种专为大规模数据处理而设计的通用计算引擎,近年来,随着大数据平台Spark系统的出现和逐步发展成熟,如何在Spark平台上实现各种机器学习和数据挖掘并行化算法设计成为了目前国内外关注的重点。目前,在基于Spark平台进行数据分析的时候,每新增一类业务统计,开发人员需要重新开发统计代码,需要耗费较多的时间成本和人力成本,而且,业务及其统计规则的变更会引起代码的频繁修改,导致较高的出错几率和测试成本,随着时间的变迁和业务的频繁变化,代码也会越来越臃肿,导致代码难于维护,因而,现有的基于Spark平台进行数据统计的代码灵活性还有待提高。
技术实现思路
本专利技术的主要目的在于提出一种数据统计方法、装置及计算机可读存储介质,旨在提高基于Spark平台进行数据统计的代码灵活性,降低代码的开发维护成本。为实现上述目的,本专利技术提供一种数据统计方法,所述数据统计方法包括如下步骤:获取待统计的原始数据流;根据所述原始数据流调用并解析预设的数据统计配置文件,得到预设类型的待生成统计报表的预处理类信息和统计条件信息;根据所述预处理类信息对所述原始数据流进行预处理,得到对应的统计元数据;根据所述统计条件信息对所述统计元数据进行统计,根据统计结果生成对应的统计报表。优选地,所述获取待统计的原始数据流的步骤之前,还包括:设置待生成统计报表的类型,并为每种类型的待生成统计报表设置对应的预处理类信息和统计条件信息;将设置结果保存至数据统计配置文件中。优选地,所述获取待统计的原始数据流的步骤包括:向预设的业务消息系统发送消息数据请求;接收所述业务消息系统基于所述消息数据请求返回的消息数据流,将所述消息数据流作为待统计的原始数据流。优选地,所述根据所述预处理类信息对所述原始数据流进行预处理,得到对应的统计元数据的步骤包括:根据所述预处理类信息中的分隔符将所述原始数据流分割为若干个预处理类;按照预设的格式转换规则对每个预处理类下的原始数据流进行格式转换,得到对应的统计元数据。优选地,所述根据所述统计条件信息对所述统计元数据进行统计,根据统计结果生成对应的统计报表的步骤包括:根据所述统计条件信息中的逻辑运算表达式对所述统计元数据进行逻辑运算;根据所述逻辑运算结果生成对应的统计报表。优选地,所述根据所述逻辑运算结果生成对应的统计报表的步骤之后,还包括:将生成的所述统计报表存储至Spark平台的数据库中。优选地,所述数据统计方法还包括:接收用户的修改指令,根据所述修改指令对所述数据统计配置文件进行修改。此外,为实现上述目的,本专利技术还提供一种数据统计装置,所述数据统计装置包括:获取模块,用于获取待统计的原始数据流;调用解析模块,用于根据所述原始数据流调用并解析预设的数据统计配置文件,得到预设类型的待生成统计报表的预处理类信息和统计条件信息;预处理模块,用于根据所述预处理类信息对所述原始数据流进行预处理,得到对应的统计元数据;统计模块,用于根据所述统计条件信息对所述统计元数据进行统计,根据统计结果生成对应的统计报表。此外,为实现上述目的,本专利技术还提供一种数据统计设备,所述数据统计设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据统计程序,所述数据统计程序被所述处理器执行时实现如下步骤:获取待统计的原始数据流;根据所述原始数据流调用并解析预设的数据统计配置文件,得到预设类型的待生成统计报表的预处理类信息和统计条件信息;根据所述预处理类信息对所述原始数据流进行预处理,得到对应的统计元数据;根据所述统计条件信息对所述统计元数据进行统计,根据统计结果生成对应的统计报表。此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有数据统计程序,所述数据统计程序被处理器执行时实现如下步骤:获取待统计的原始数据流;根据所述原始数据流调用并解析预设的数据统计配置文件,得到预设类型的待生成统计报表的预处理类信息和统计条件信息;根据所述预处理类信息对所述原始数据流进行预处理,得到对应的统计元数据;根据所述统计条件信息对所述统计元数据进行统计,根据统计结果生成对应的统计报表。本专利技术Spark平台获取待统计的原始数据流;根据所述原始数据流调用并解析预设的数据统计配置文件,得到预设类型的待生成统计报表的预处理类信息和统计条件信息;根据所述预处理类信息对所述原始数据流进行预处理,得到对应的统计元数据;根据所述统计条件信息对所述统计元数据进行统计,根据统计结果生成对应的统计报表。本专利技术通过在Spark平台中设置数据统计配置文件,并在数据统计配置文件中写入预设类型的待生成统计报表的预处理类信息和统计条件信息,实现了基于Spark平台进行数据统计,相对于现有技术,在业务或统计规则变更时,开发人员只需修改数据统计配置文件中的配置信息,而无需重新开发新的统计代码,从而提高了基于Spark平台进行数据统计的代码灵活性,降低了代码的开发维护成本。附图说明图1是本专利技术实施例方案涉及的硬件运行环境的设备结构示意图;图2为本专利技术数据统计方法第一实施例的流程示意图;图3为本专利技术实施例中对原始话单进行统计分析的流程示意图;图4为本专利技术数据统计方法第二实施例的流程示意图;图5为本专利技术数据统计方法第三实施例的流程示意图;图6为本专利技术数据统计方法第四实施例的流程示意图;图7为本专利技术数据统计装置一实施例的功能模块示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术实施例的主要解决方案是:获取待统计的原始数据流;根据所述原始数据流调用并解析预设的数据统计配置文件,得到预设类型的待生成统计报表的预处理类信息和统计条件信息;根据所述预处理类信息对所述原始数据流进行预处理,得到对应的统计元数据;根据所述统计条件信息对所述统计元数据进行统计,根据统计结果生成对应的统计报表。现有技术中,在基于Spark平台进行数据分析的时候,每新增一类业务统计,开发人员需要重新开发统计代码,需要耗费较多的时间成本和人力成本,而且,业务及其统计规则的变更会引起代码的频繁修改,导致较高的出错几率和测试成本,随着时间的变迁和业务的频繁变化,代码也会越来越臃肿,导致代码难于维护。本专利技术通过在Spark平台中设置数据统计配置文件,并在数据统计配置文件中写入预设类型的待生成统计报表的预处理类信息和统计条件信息,实现了基于Spark平台进行数据统计,相对于现有技术,在业务或统计规则变更时,开发人员只需修改数据统计配置文件中的配置信息,而无需重新开发新的统计代码,从而提高了基于Spark平台进行数据统计的代码灵活性,降低了代码的开发维护成本。本专利技术提供一种数据统计方法。如图1所示,图1是本专利技术实施例方案涉及的硬件运行环境的设备结构示意图。本专利技术实施例数据统计设备可以是服务器、PC机或虚拟机设备。如图1所示,该数据统计设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中本文档来自技高网...

【技术保护点】
1.一种数据统计方法,其特征在于,所述数据统计方法包括如下步骤:获取待统计的原始数据流;根据所述原始数据流调用并解析预设的数据统计配置文件,得到预设类型的待生成统计报表的预处理类信息和统计条件信息;根据所述预处理类信息对所述原始数据流进行预处理,得到对应的统计元数据;根据所述统计条件信息对所述统计元数据进行统计,根据统计结果生成对应的统计报表。

【技术特征摘要】
1.一种数据统计方法,其特征在于,所述数据统计方法包括如下步骤:获取待统计的原始数据流;根据所述原始数据流调用并解析预设的数据统计配置文件,得到预设类型的待生成统计报表的预处理类信息和统计条件信息;根据所述预处理类信息对所述原始数据流进行预处理,得到对应的统计元数据;根据所述统计条件信息对所述统计元数据进行统计,根据统计结果生成对应的统计报表。2.如权利要求1所述的数据统计方法,其特征在于,所述获取待统计的原始数据流的步骤之前,还包括:设置待生成统计报表的类型,并为每种类型的待生成统计报表设置对应的预处理类信息和统计条件信息;将设置结果保存至数据统计配置文件中。3.如权利要求1所述的数据统计方法,其特征在于,所述获取待统计的原始数据流的步骤包括:向预设的业务消息系统发送消息数据请求;接收所述业务消息系统基于所述消息数据请求返回的消息数据流,将所述消息数据流作为待统计的原始数据流。4.如权利要求1至3中任一项所述的数据统计方法,其特征在于,所述根据所述预处理类信息对所述原始数据流进行预处理,得到对应的统计元数据的步骤包括:根据所述预处理类信息中的分隔符将所述原始数据流分割为若干个预处理类;按照预设的格式转换规则对每个预处理类下的原始数据流进行格式转换,得到对应的统计元数据。5.如权利要求4所述的数据统计方法,其特征在于,所述根据所述统计条件信息对所述统计元数据进行统计,根据统计结果生成对应的统计报表的步骤包括:根据所述统计条件信息中的逻辑运算表达式对所述统计元数据进行逻辑运算;根据所述逻辑运算结果生成对应的统计报表。6.如权利要求5所述的数据统计方法,其特征在于,所述根据所述逻辑运算结果生成对应的统计报表的步骤之后,还包括:将生成的...

【专利技术属性】
技术研发人员:范晓亮余俊
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1