一种基于大数据的服务器运行日志结构化存储方法技术

技术编号：18165743 阅读：15 留言：0更新日期：2018-06-09 11:36

本发明专利技术提供一种基于大数据的服务器运行日志结构化存储方法，按照统一的时间点和时间间隔采集集群服务器的日志文件数据并发送给大数据平台，采集的同时制作时间戳；根据时间戳制作集群服务器数据的时间维度表；大数据平台将接收到的日志文件数据后经MAP处理成Key‑Value格式；然后进行多维度的多层嵌套，并将时间标签作为最外层维度，最后再进行分布式存储；查询时通过大数据分布式计算引擎先根据时间标签和时间维度表在时间维度上查询以获得满足条件的集群服务器的日志文件数据。本发明专利技术基于大数据平台实现分布式存储和计算，通过MAP操作实现数据的结构化，从而有效解决服务器集群日志文件不断膨胀的海量数据的存储问题，且支持SQL、NoSQL查询方式。

A structured storage method for server running logs based on big data

The invention provides a structured storage method for server running log based on large data, collecting log file data of cluster server according to unified time point and time interval, sending it to large data platform, making time stamp at the same time, making time dimension table of cluster server data according to time stamp; large number. According to the log file data received by the platform, it is processed into Key Value format by MAP, and then multi-dimensional nesting is carried out, and the time label is used as the outermost dimension, and then the distributed storage is carried out. Query to get the log file data of the clustered server that meets the requirements. The invention is based on the large data platform to realize distributed storage and calculation. The data is structured through MAP operation, which can effectively solve the problem of storage of massive data which are expanding in the server cluster log file, and support the SQL and NoSQL query methods.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于大数据的服务器运行日志结构化存储方法
本专利技术涉及一种服务器运行日志的存储方法，特别涉及一种基于大数据的服务器运行日志的存储方法。
技术介绍
服务器的环境中存在日志文件数据存储的问题，如果每秒钟采集服务器性能指标，一台服务器一天日志量约为260MB，一台服务器一年的日志量约为100GB，如果有50台服务器，则一年的日志量将是个海量数据。而现有服务器日志的存储方法是通过部署运维监控软件收集服务器的运行日志数据以纯文本格式存储到本地文件系统或者关系型数据库系统，都难以解决日志文件存储数据量庞大的问题，传统的方案只能定时删除日志文件，并且海量数据的访问效率极慢，无法实现数据的访问和分析。
技术实现思路
本专利技术要解决的技术问题，在于提供一种基于大数据的服务器运行日志结构化存储方法，基于大数据平台实现分布式存储和分布式计算存储，通过MAP操作实现服务器运维日志数据的结构化，可以实现SQL、NoSQL等常用查询方式。本专利技术是这样实现的：一种基于大数据的服务器运行日志结构化存储方法，按照统一的时间点和时间间隔采集集群服务器的日志文件数据并发送给大数据平台，采集的同时制作时间戳；根据时间戳制作集群服务器数据的时间维度表；大数据平台将接收到的日志文件数据后经MAP处理成Key-Value格式；通过大数据平台将Key-Value格式的日志文件数据进行多维度的多层嵌套，并将时间标签作为最外层维度，最后再进行分布式存储；查询时通过大数据分布式计算引擎先根据时间标签和时间维度表在时间维度上查询以获得满足条件的集群服务器的日志文件数据。进一步的，所述集群服务器上部署有时...

【技术保护点】
一种基于大数据的服务器运行日志结构化存储方法，其特征在于：按照统一的时间点和时间间隔采集集群服务器的日志文件数据并发送给大数据平台，采集的同时制作时间戳；根据时间戳制作集群服务器数据的时间维度表；大数据平台将接收到的日志文件数据后经MAP处理成Key‑Value格式；通过大数据平台将Key‑Value格式的日志文件数据进行多维度的多层嵌套，并将时间标签作为最外层维度，最后再进行分布式存储；查询时通过大数据分布式计算引擎先根据时间标签和时间维度表在时间维度上查询以获得满足条件的集群服务器的日志文件数据。

【技术特征摘要】
1.一种基于大数据的服务器运行日志结构化存储方法，其特征在于：按照统一的时间点和时间间隔采集集群服务器的日志文件数据并发送给大数据平台，采集的同时制作时间戳；根据时间戳制作集群服务器数据的时间维度表；大数据平台将接收到的日志文件数据后经MAP处理成Key-Value格式；通过大数据平台将Key-Value格式的日志文件数据进行多维度的多层嵌套，并将时间标签作为最外层维度，最后再进行分布式存储；查询时通过大数据分布式计算引擎先根据时间标签和时间维度表在时间维度上查询以获得满足条件的集群服务器的日志文件数据。2.根据权利要求1所述的一种基于进化算法的交互式本体匹配方法，其特征在于：所述集群服务器上部署有时间同步器，实现每台服务器的...

【专利技术属性】
技术研发人员：黄桥藩，
申请(专利权)人：福建星瑞格软件有限公司，
类型：发明
国别省市：福建,35

全部详细技术资料下载我是这个专利的主人