【技术实现步骤摘要】
一种基于大数据的日志处理方法、装置及相关产品
[0001]本申请涉及大数据领域,特别是涉及一种基于大数据的日志处理方法
、
装置及相关产品
。
技术介绍
[0002]随着科技的不断发展,数据的数量也在不断地增长,为了适应时代的发展,大数据这个概念应运而生,大数据指的是在传统数据处理应用软件不足以处理过大或过于复杂的数据集
。
大数据一般以大数据平台为载体,大数据平台指的是可以应对海量的数据存储
、
海量的数据计算
、
数据实时计算以及数据的调用查看等场景的平台
。
在大数据平台中一般会存储海量的日志
。
[0003]当运维人员查看某些大数据平台上的日志时,在大数据平台的前端显示的日志一般会带有一连串的前缀或者带有一些运维人员难以理解的代码,运维人员对这些日志有很高的理解成本
。
[0004]为此,如何在大数据平台的前端显示更加便于运维人员理解的日志成为了本领域技术人员亟需解决的技术问题
。
技术实现思路
[0005]基于上述问题,本申请提供了一种基于大数据的日志处理方法
、
装置及相关产品以解决通过现有技术运维人员对调用的日志理解成本较高的问题,所述方法包括以下步骤:
[0006]在大数据平台中获取待处理日志;
[0007]使用聚类算法对待处理日志进行聚类,得到待处理日志类和舍弃日志类;
[0008]生成所述待处理日志类对应的日志模板, ...
【技术保护点】
【技术特征摘要】
1.
一种基于大数据的日志处理方法,其特征在于,包括:在大数据平台中获取待处理日志;使用聚类算法对待处理日志进行聚类,得到待处理日志类和舍弃日志类;生成所述待处理日志类对应的日志模板,所述日志模板包括操作者
、
操作时间
、
操作内容和操作结果;将所述待处理日志类中的待处理日志分别作为目标待处理日志,将目标待处理日志的操作者
、
操作时间
、
操作内容和操作结果分别作为所述日志模板的操作者
、
操作时间
、
操作内容和操作结果,得到目标结构化日志;将所述目标结构化日志存储于所述大数据平台中
。2.
根据权利要求1所述的方法,其特征在于,所述使用聚类算法对待处理日志进行聚类,得到待处理日志类和舍弃日志类包括:使用聚类算法按照操作类型对待处理日志进行聚类,得到至少两个操作类型对应的日志类;将至少两个操作类型对应的日志类按照预设的操作类型进行分类得到待处理日志类和舍弃日志类
。3.
根据权利要求2所述的方法,其特征在于,所述预设的操作类型包括:预设的保留日志类对应的操作类型和预设的舍弃日志类对应的操作类型;所述预设的保留日志类对应的操作类型包括创建表的操作类型和查询表的操作类型,所述预设的舍弃日志类对应的操作类型包括按照程序自动生成日志的操作类型
。4.
根据权利要求1所述的方法,其特征在于,所述使用聚类算法对待处理日志进行聚类,得到待处理日志类和舍弃日志类包括:使用聚类算法按照日志的状态对待处理日志进行聚类,得到正常日志类和异常日志类;将异常日志类作为待处理日志类,将正常日志类作为舍弃日志类
。5.
根据权利要求1所述的方法,其特征在于,所述方法进一步包括:响应于对日志的调用请求,判断所述日志是否存在对应的结构化日志;若是,则使用所述结构化日志回复所述调...
【专利技术属性】
技术研发人员:王子琦,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。