一种数据处理方法及系统技术方案

技术编号：22237933 阅读：24 留言：0更新日期：2019-10-09 17:52

本申请提供一种数据处理方法及系统，该方法利用开源采集软件FLUME采集服务器中各个服务实例的业务日志信息，对采集到的每个业务日志信息分别进行标准化处理，得到对应的标准日志数据，并将标准日志数据放入KAFKA消息队列中，然后利用SPARK从KAFKA消息队列中读取标准日志数据，并对读取到的标准日志数据进行异常调用统计得到异常调用结果。由于对各个服务实例中的业务日志信息统一汇总后的数据进行异常调用统计，因此可以实现确定业务调用中存在的服务异常调用情况的目的。

A Data Processing Method and System

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法及系统
本申请属于数据处理
，尤其涉及一种数据处理方法及系统。
技术介绍
在分布式系统中，业务需要调用不同服务实例中的服务，导致该业务没有统一的业务日志信息，从而无法根据该业务的业务日志信息确定异常调用。
技术实现思路
有鉴于此，本申请的目的在于提供一种数据处理方法及系统，用于解决现有技术中无法确定异常调用的问题。技术方案如下：本申请提供一种数据处理方法，包括：在每个服务器中分别启动开源采集软件FLUME，并利用开源采集软件FLUME采集该服务器中各个服务实例的业务日志信息；对采集到的每个业务日志信息分别进行标准化处理，得到对应的标准日志数据；并将所述标准日志数据放入KAFKA消息队列；利用SPARK从KAFKA消息队列中读取标准日志数据；对读取到的标准日志数据进行异常调用统计得到异常调用结果。优选地，所述标准日志数据包括：用户标识、企业标识、实例标识、服务标识、发起端IP、开始时间、结束时间以及调用结果；则所述对读取到的标准日志数据进行异常调用统计得到异常调用结果包括：根据所述调用结果，确定调用服务失败的标准日志数据；从全部调用服务失败的标准日志数据中，确定在预设时间内的每项服务的调用总次数和每项服务的调用总时长；针对每项服务，确定该服务的调用总次数是否超过该服务的平均调用次数，且该服务的调用总时长是否超过该服务的平均调用时长；若确定该服务的调用总次数超过该服务的平均调用次数且该服务的调用总时长超过该服务的平均调用时长，则确定该服务出现异常调用。优选地，还包括：从全部标准日志数据中，确定在预设时间内每项服务的调用频率；确定所述调用频率是...

【技术保护点】
1.一种数据处理方法，其特征在于，包括：在每个服务器中分别启动开源采集软件FLUME，并利用开源采集软件FLUME采集该服务器中各个服务实例的业务日志信息；对采集到的每个业务日志信息分别进行标准化处理，得到对应的标准日志数据；并将所述标准日志数据放入KAFKA消息队列；利用SPARK从KAFKA消息队列中读取标准日志数据；对读取到的标准日志数据进行异常调用统计得到异常调用结果。

【技术特征摘要】
1.一种数据处理方法，其特征在于，包括：在每个服务器中分别启动开源采集软件FLUME，并利用开源采集软件FLUME采集该服务器中各个服务实例的业务日志信息；对采集到的每个业务日志信息分别进行标准化处理，得到对应的标准日志数据；并将所述标准日志数据放入KAFKA消息队列；利用SPARK从KAFKA消息队列中读取标准日志数据；对读取到的标准日志数据进行异常调用统计得到异常调用结果。2.根据权利要求1所述的方法，其特征在于，所述标准日志数据包括：用户标识、企业标识、实例标识、服务标识、发起端IP、开始时间、结束时间以及调用结果；则所述对读取到的标准日志数据进行异常调用统计得到异常调用结果包括：根据所述调用结果，确定调用服务失败的标准日志数据；从全部调用服务失败的标准日志数据中，确定在预设时间内的每项服务的调用总次数和每项服务的调用总时长；针对每项服务，确定该服务的调用总次数是否超过该服务的平均调用次数，且该服务的调用总时长是否超过该服务的平均调用时长；若确定该服务的调用总次数超过该服务的平均调用次数且该服务的调用总时长超过该服务的平均调用时长，则确定该服务出现异常调用。3.根据权利要求2所述的方法，其特征在于，还包括：从全部标准日志数据中，确定在预设时间内每项服务的调用频率；确定所述调用频率是否超过平均调用频率；若确定所述调用频率超过平均调用频率，则确定该服务出现异常调用。4.根据权利要求2或3所述的方法，其特征在于，还包括：利用开源采集软件FLUME采集该服务器的性能日志信息；根据所述服务器的性能日志信息，确定各个服务实例中服务器资源利用率超过预设阈值的服务实例；对服务器资源利用率超过预设阈值的服务实例中，按照服务实例的调用次数按照由多到少的顺序进行排列，并按照顺序选择预设位数的服务实例；确定选择的服务实例为异常调用的服务。5.根据权利要求4所述的方法，其特征在于，还包括：根据所述用户标识、所述服务标识和所述开始时间，确定同一用户标识在预设时间段内调用各个服务的顺序；建立与该用户标识对应用户的调用服务的关系日志信息。6.一种数据处理系统，其特征在于，包括：采集单元，用于在每个服务器中分别启动开源采集软件FLUME，并利用开源采集软件F...

【专利技术属性】
技术研发人员：马长青，
申请(专利权)人：北京慧眼智行科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人