【技术实现步骤摘要】
本专利技术涉及P2P网络信息安全领域,是一种能够应用于P2P网络的,高效识别P2P应用流量的方法及系统。
技术介绍
随着互联网应用的广泛使用,网络应用已经呈现出很多类别,尤其是P2P应用流量的暴增,占据了巨大的网络带宽,不利于高质量的服务,同时给网络运营商带来很多管理问题。P2P是一种分布式网络,网络的参与者共享他们所拥有的一部分硬件资源(处理能力、存储能力、网络连接能力等),这些资源能被其他对等点peer直接访问而无须经过中间实体。P2P网络结构复杂,网络拓扑具有动态性,绝大多数流量在传输过程中进行加密,为了提高P2P应用流量分类准确率和稳定性,科学管理规划网络,各类P2P应用识别技术应运而生。(1)基于P2P端口的分类技术。在P2P网络通信过程中,无论是客户端还是服务端,或者是一个Peer节点,必须提供IP地址和端口和另一方进行通信。该方法需要截取数据包头的五元组,并判断端口是否为P2P网络应用的端口即可。基于端口的识别方法优点是简单,容易实现,分类性能很高,具有较高的实时性,所以可以应用于高速网络环境下。但是对于P2P应用来说,大多采用了端口跳变的技术,该方法主要存在的缺点是受限于注册端口数目识别数量有限并且随着新的网络应用的不断增多其可以识别应用的比重越来越低,分类准确率不稳定。(2)基于有效负载的P2P应用分类技术。通过具体分析有效载荷中包含特定字符串(签名信息)用以标识应用,识别有效载荷中一些协商固定 ...
【技术保护点】
一种高效的P2P应用流量分类方法,其步骤为:1)P2P分类服务器从采集的每一数据包中获取四元组信息、协议信息、包长信息对该数据包进行标记,然后将标记的数据包存储在信息结构体中;2)P2P分类服务器从信息结构体中提取每条指定流的N个数据包,并计算每条P2P应用流的基本统计特征;3)根据离线配置好的分类特征数值对步骤2)得到的基本统计特征进行分类;4)根据步骤3)得到的结果计算单位时间窗口内每条P2P应用流的通信属性;5)根据当前窗口内同一P2P应用流的通信属性计算该P2P应用流的卡方统计量χ2;如果卡方统计量χ2超过设定阈值,则去除该P2P应用流的应用分类标记;如果出现未识别的P2P应用流,则将该未识别的P2P应用流标记为当前窗口内具有相同IP和端口PORT的P2P应用流。
【技术特征摘要】
1.一种高效的P2P应用流量分类方法,其步骤为:
1)P2P分类服务器从采集的每一数据包中获取四元组信息、协议信息、包长信息对该数
据包进行标记,然后将标记的数据包存储在信息结构体中;
2)P2P分类服务器从信息结构体中提取每条指定流的N个数据包,并计算每条P2P应用
流的基本统计特征;
3)根据离线配置好的分类特征数值对步骤2)得到的基本统计特征进行分类;
4)根据步骤3)得到的结果计算单位时间窗口内每条P2P应用流的通信属性;
5)根据当前窗口内同一P2P应用流的通信属性计算该P2P应用流的卡方统计量χ2;如果
卡方统计量χ2超过设定阈值,则去除该P2P应用流的应用分类标记;如果出现未识别
的P2P应用流,则将该未识别的P2P应用流标记为当前窗口内具有相同IP和端口
PORT的P2P应用流。
2.如权利要求1所述的方法,其特征在于,所述通信属性包括端口离散性f1、输入输出流量
比f2、大窗口连续性f3、小窗口短暂性f4。
3.如权利要求2所述的方法,其特征在于,端口离散性f1=Hash(ClientPort),ClientPort为
客户端端口值;输入输出流量比fbytes为输入字节数、bbytes为输出字节数;
大窗口连续性big_wins为包负载长度大于初始化窗口长度的包的数
量,flow_packets为整条流的包数;小窗口短暂性small_wins为包负
载小于流前三个包长的包数。
4.如权利要求1或2或3所述的方法,其特征在于,卡方统计量其中,
EWi是当前窗口前N-1窗口内被标记为同一P2P应用流的第i个通信属性的均值,n为通
信属性总数。
5.如权利要求1或2或3所述的方法,其特征在于,每条流的基本统计特征包括P2P流量中
的TCP统计特征和P2P流量中的UDP统计特征。
6.如权利要求1所述的方法,其特征在于,所述步骤3)中,P2P分类服务器将每条P2P应
用流的分...
【专利技术属性】
技术研发人员:常鹏,张永铮,庹宇鹏,
申请(专利权)人:中国科学院信息工程研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。