The present invention discloses a method of large data analysis processing, which includes the following steps: obtaining the pending data, the decomposition regular expression of the data segment, and the list of data term names corresponding to the decomposed regular expression of the data segment; decomposing the regular expression according to the data segment to carry out data in the data segment of the analyzed data. The data item values are generated, and the values of the data items are associated with the list of the names of the data items to form the intermediate data pairs that correspond to the data item names and the values of the data items. By setting the regular expression of data segment decomposition and the list of data item names corresponding to the regular expression of the data segment, the invention realizes the decomposition and extraction of the different requirements of the analysis data, and improves the universality of the data analysis.
【技术实现步骤摘要】
一种大数据分析处理方法
本专利技术涉及一种处理方法,具体是一种大数据分析处理方法。
技术介绍
近几年,由于数据在互联网领域的持续增长,各公司都面临海量数据的处理需求。部门内的数据分析主要为公司各部门运维服务,数据分析主要基于各部门的服务器产生的日志来进行分析,目的是基于这些日志对用户访问、数据流量在时间维度、产品线维度、域名维度等有明确的量化数据,从而为公司服务器运维管理、流量分配、预估等提供建议。在现有的数据分析系统中,针对用户不同的分析需求,需要采用专用的数据分析方法,即针对用户不同的分析需求,都需要设计一套数据分析方法。因此,导致数据分析的效率底下,成本高昂。
技术实现思路
本专利技术的目的在于提供一种大数据分析处理方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种大数据分析处理方法,包括如下步骤:获取待分析数据、数据段分解正则表达式和与所述数据段分解正则表达式对应的数据项名称列表;根据所述数据段分解正则表达式对所述待分析数据中的数据段进行数据分解,生成数据项值,并将数据项值与所述数据项名称列表进行关联,形成数据项名称与数据项值对应的中间数据对;根据设定统计规则,对所述中间数据对进行统计分析,接收源数据库发送的日志信息,所述日志信息用于表示所述源数据库中的数据修改操作;获取所述日志信息中所述数据修改操作的类型和参数,并将获取的所述数据修改操作的参数绑定到与所述数据修改操作的类型对应的语句模板中,生成数据修改操作语句;运行所述数据修改操作语句,完成对目标数据库中相同存储位置的数据的修改,得到数据分析结果。作为本专利技术进 ...
【技术保护点】
1.一种大数据分析处理方法,其特征在于,包括如下步骤:获取待分析数据、数据段分解正则表达式和与所述数据段分解正则表达式对应的数据项名称列表;根据所述数据段分解正则表达式对所述待分析数据中的数据段进行数据分解,生成数据项值,并将数据项值与所述数据项名称列表进行关联,形成数据项名称与数据项值对应的中间数据对;根据设定统计规则,对所述中间数据对进行统计分析,接收源数据库发送的日志信息,所述日志信息用于表示所述源数据库中的数据修改操作;获取所述日志信息中所述数据修改操作的类型和参数,并将获取的所述数据修改操作的参数绑定到与所述数据修改操作的类型对应的语句模板中,生成数据修改操作语句;运行所述数据修改操作语句,完成对目标数据库中相同存储位置的数据的修改,得到数据分析结果。
【技术特征摘要】
1.一种大数据分析处理方法,其特征在于,包括如下步骤:获取待分析数据、数据段分解正则表达式和与所述数据段分解正则表达式对应的数据项名称列表;根据所述数据段分解正则表达式对所述待分析数据中的数据段进行数据分解,生成数据项值,并将数据项值与所述数据项名称列表进行关联,形成数据项名称与数据项值对应的中间数据对;根据设定统计规则,对所述中间数据对进行统计分析,接收源数据库发送的日志信息,所述日志信息用于表示所述源数据库中的数据修改操作;获取所述日志信息中所述数据修改操作的类型和参数,并将获取的所述数据修改操作的参数绑定到与所述数据修改操作的类型对应的语句模板中,生成数据修改操作语句;运行所述数据修改操作语句,完成对目标数据库中相同存储位置的数据的修改,得到数据分析结果。2.根据权利要求1所述的大数据分析处理方法,其特征在于,在根据所述数据段分解正则表达式对所述待分析数据中的数据段进行数据分解之前,还包括:获取边界鉴定正则表达式,并对所述待分析数据应用所述边界鉴定正则表达式进行边界鉴定,提取出所述待分析数据中的数据段。3.根据权利要求1所述的大数据分析处理方法,其特征在于,所述将获取...
【专利技术属性】
技术研发人员:戴亚娥,
申请(专利权)人:浙江工商职业技术学院,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。