数据存储监控方法技术

技术编号：14512363 阅读：176 留言：0更新日期：2017-02-01 09:57

本发明专利技术提供了一种数据存储监控方法，该方法包括：将原始数据流中的报头信息上传到分布式文件存储系统中，再利用Samza计算平台以源服务器IP为键，以网络数据流属性信息为值，对数据报文进行聚类分析，以对数据量进行监控。本发明专利技术提出了一种数据存储监控方法，适应面向不同数据集和响应要求的安全事件监控需求，很好地解决实时性和监控效率之间的平衡问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据处理，特别涉及一种数据存储监控方法。
技术介绍
用户在享受网络设施和服务带来的便利的同时，安全问题也逐步升级。由于无线网络的普及，在许多公共场所，用户越来越多的将个人敏感数据存储或传递到网络中和存储在云平台上。而黑客所能利用的信息也随着网络服务和信息量的增加而增多，他们采用扫描端口、暴力破解、等漏洞对目标服务器进行监控。网络安全监控面临着两个亟待解决的问题，一是所要监控的目标系统数据量庞大，以往的非正常事件监控平台很难应对如此庞大的数据量。二是如何利用好大数据以及云平台，从而为安全事件监控提供良好的计算基础。以往技术集中在将网络日志、深度包数据应用在云平台下进行分布式计算，并没有考虑到从数据输入、计算、存储、前台展现等一系列围绕云平台架构的问题。同时，没有考虑实际网络中应对突发数据量，以及通过及时更新学习库对未知非正常进行记录和监控等问题。
技术实现思路
为解决上述现有技术所存在的问题，本专利技术提出了一种数据存储监控方法，包括：将原始数据流中的报头信息上传到分布式文件存储系统中，再利用Samza计算平台以源服务器IP为键，以网络数据流属性信息为值，对数据报文进行聚类分析，以对数据量进行监控。优选地，所述方法进一步包括：针对网络原始数据流，对数据包进行捕获，然后将数据流报头信息剥离，对于直接能够应用条件过滤对数据流进行过滤的非正常数据流，在进入计算处理过程之前，即上传到分布式文件存储系统之前对数据进行过滤判断，将结果存储在分布式文件存储系统上；将聚类结果存储进入学习库，作为下次分类的依据，将监控结果存入数据库，分别用于阈值分析、非正常监控和...

【技术保护点】
一种数据存储监控方法，其特征在于，包括：将原始数据流中的报头信息上传到分布式文件存储系统中，再利用Samza计算平台以源服务器IP为键，以网络数据流属性信息为值，对数据报文进行聚类分析，以对数据量进行监控。

【技术特征摘要】
1.一种数据存储监控方法，其特征在于，包括：将原始数据流中的报头信息上传到分布式文件存储系统中，再利用Samza计算平台以源服务器IP为键，以网络数据流属性信息为值，对数据报文进行聚类分析，以对数据量进行监控。2.根据权利要求1所述的方法，其特征在于，所述方法进一步包括：针对网络原始数据流，对数据包进行捕获，然后将数据流报头信息剥离，对于直接能够应用条件过滤对数据流进行过滤的非正常数据流，在进入计算处理过程之前，即上传到分布式文件存储系统之前对数据进行过滤判断，将结果存储在分布式文件存储系统上；将聚类结果存储进入学习库，作为下次分类的依据，将监控结果存入数据库，分别用于阈值分析、非正常监控和数据显示；在数据流监控中，通过聚类算法构建数据流类型集合，对存在于学习库中的集合进行分类划分，从而发现网络中存在的攻击；其中，在将原始数据流上传到分布式文件存储系统中之前，将部分报头信息正则化并存储后，形成聚类...

【专利技术属性】
技术研发人员：张敬华，程映忠，王松，
申请(专利权)人：四川新环佳科技发展有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人