当前位置: 首页 > 专利查询>四川大学专利>正文

一种基于K-Means的正常ServerIP白名单的挖掘方法技术

技术编号:27561796 阅读:41 留言:0更新日期:2021-03-09 22:04
本发明专利技术涉及计算机网络流量分析技术领域,旨在通过K-Means聚类算法对网络流量进行聚类,从而挖掘出正常Server IP白名单。本发明专利技术首先采集所需通信流量,从中还原出两个IP间的双向流,并提取出初始白名单,然后解析双向流统计流基础信息并保存,之后便根据统计的流基础信息进行特征提取,将特征用K-Means算法进行聚类,最后统计初始白名单在聚类结果中的分布从而得到正常Server IP白名单。本发明专利技术能够方便的从网络流量中提取出正常Server IP白名单,减少建立白名单时的工作量,并且更新方便。并且更新方便。并且更新方便。

【技术实现步骤摘要】
一种基于K-Means的正常Server IP白名单的挖掘方法


[0001]本专利技术涉及计算机网络流量分析
,旨在通过抓取网络流量并重组为双向流,然后以Server IP为研究对象提取对应流的相关特征,利用K-Means聚类算法对特征数据进行聚类,再分析预先构建的白名单在聚类结果中的分布,从而挖掘出正常Server IP白名单,得到该白名单后,便可以过滤掉许多正常网络行为产生的流量,减小入侵检测系统的检测压力。

技术介绍

[0002]随着计算机技术与物联网技术的不断发展与普及,联网设备数量迅速增长,且联网设备产生的流量也越来越多,这对入侵检测系统(IDS)带来了巨大的挑战。入侵检测系统通过对网络流量进行实时监控,发现存在于其中的异常行为,但实际经过入侵检测系统的大部分流量其实是正常网络行为产生的流量,这种流量占比高且数量大,十分影响入侵检测系统的检测效率。
[0003]为了解决输入入侵检测系统的待检测流量正常流量占比较大的问题,需要对原始流量进行过滤,从而减小待检测流量的数量。目前主流的过滤方法为基于策略的过滤,通过编写规则文件本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于K-Means的正常Server IP白名单的挖掘方法,其特征在于,所述方法包括如下步骤:A. 采集大量的网络流量并进行解析,提取出常用互联网公司的Server IP及对应域名并保存得到初始白名单,然后还原两个IP间的双向流并保存为pcap文件;B. 根据步骤A得到的双向流pcap文件,进行解析然后统计分析流的基本信息;C. 根据步骤B得到的流信息,以Server IP为研究对象提取流特征;D. 利用K-Means聚类算法进行聚类,然后分析聚类结果得到正常Server IP白名单。2.根据权利要求1所述的一种基于K-Means的正常Server IP白名单的挖掘方法,其特征在于,所述的步骤A进一步包括如下步骤:A1. 通过Wireshark和Streamdump流量采集工具采集所需网络流量并保存为pcap文件;A2. 利用Streamdump解析出两个IP间的双向流,保存四元组参数命名IP[Port]-IP[Port].pcap文件;A3. 从采集的网络流量中提取出常用域名的Server IP构建初始白名单。3.根据权利要求1所述的一种基于K-Means的正常Server IP白名单的挖掘方法,其特征在于,所述的步骤B进一步包括如下步骤:B1. 利用Streamdump解析步骤A中得到的四元组参数命名pcap文件;B2. 根据解析结果,统计实验所需相关流信息;B3. 提取的流信息具体包括:流开始时间戳、源地址、目的地址、源端口、目的端口、上行包个数、下行包个数、上行包总载荷大小(网络层)、下行包总载荷大小(网络层)、传输层上行包载荷不为0个数、传输层下行包载荷不为0个数、目的地址对应的域名、上...

【专利技术属性】
技术研发人员:刘亮李凯郑荣锋
申请(专利权)人:四川大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1