一种服务器的分类方法及分类系统技术方案

技术编号:17813195 阅读:51 留言:0更新日期:2018-04-28 05:45
本发明专利技术公开了一种服务器的分类方法及分类系统,其中,所述方法包括:获取训练样本集,所述训练样本集中包括训练服务器对应的特征向量样本,所述特征向量样本根据所述训练服务器的访问数据确定,所述特征向量样本与所述训练服务器所属的服务器类型相关联;利用所述训练样本集对预设分类器进行训练,以使得训练后的预设分类器对输入的特征向量样本处理得到的分类结果与所述输入的特征向量样本关联的服务器类型一致;获取目标服务器的访问数据,并基于所述访问数据构建所述目标服务器的目标特征向量;将所述目标特征向量输入所述训练后的预设分类器中,得到所述目标服务器对应的分类结果。本申请提供的技术方案,能够提高服务器分类的效率和准确度。

【技术实现步骤摘要】
一种服务器的分类方法及分类系统
本专利技术涉及互联网
,特别涉及一种服务器的分类方法及分类系统。
技术介绍
随着国际互联网规模的日渐增大,在互联网中为用户提供各种网络服务的服务器的数量也在不断增长。通常而言,服务器在提供网络服务时往往会有侧重点。例如,有些服务器主要提供HTTP服务,有些服务器主要提供FTP服务,而有些服务器主要提供电子邮件服务。当前,可以将互联网中的服务器进行分类,然后可以按照服务器所属的类别,对服务器产生的网络流量有针对性地进行处理。例如,对于主要提供HTTP服务的服务器而言,可以优先处理HTTP服务对应的网络流量,而对于FTP服务对应的网络流量可以暂缓处理。这样,通过将服务器进行分类,可以提高服务器的服务质量,从而改善互联网用户的使用体验。目前,可以通过识别服务器产生的网络流量的类型,来对服务器进行分类。识别网络流量的类型时,一方面可以通过端口号对网络流量进行识别。比如,80端口上一般传输HTTP服务的网络流量,而21端口一般是传输ftp服务的网络流量。该方法简单易行,但由于现在越来越多的服务采用非标准端口,因此通过端口号对网络流量进行识别时,最终会影响服本文档来自技高网...
一种服务器的分类方法及分类系统

【技术保护点】
一种服务器的分类方法,其特征在于,所述方法包括:获取训练样本集,所述训练样本集中包括训练服务器对应的特征向量样本,所述特征向量样本根据所述训练服务器的访问数据确定,所述特征向量样本与所述训练服务器所属的服务器类型相关联;利用所述训练样本集对预设分类器进行训练,以使得训练后的预设分类器对输入的特征向量样本处理得到的分类结果与所述输入的特征向量样本关联的服务器类型一致;获取目标服务器的访问数据,并基于所述访问数据构建所述目标服务器的目标特征向量;将所述目标特征向量输入所述训练后的预设分类器中,得到所述目标服务器对应的分类结果。

【技术特征摘要】
1.一种服务器的分类方法,其特征在于,所述方法包括:获取训练样本集,所述训练样本集中包括训练服务器对应的特征向量样本,所述特征向量样本根据所述训练服务器的访问数据确定,所述特征向量样本与所述训练服务器所属的服务器类型相关联;利用所述训练样本集对预设分类器进行训练,以使得训练后的预设分类器对输入的特征向量样本处理得到的分类结果与所述输入的特征向量样本关联的服务器类型一致;获取目标服务器的访问数据,并基于所述访问数据构建所述目标服务器的目标特征向量;将所述目标特征向量输入所述训练后的预设分类器中,得到所述目标服务器对应的分类结果。2.根据权利要求1所述的方法,其特征在于,获取目标服务器的访问数据包括:在传输层记录与所述目标服务器建立的连接,并采集所述连接上产生的访问数据。3.根据权利要求1所述的方法,其特征在于,基于所述访问数据构建所述目标服务器的目标特征向量包括:预先确定所述目标特征向量中包含的向量分量;基于所述访问数据,确定所述向量分量的特征值,并通过所述向量分量的特征值构成所述目标特征向量。4.根据权利要求3所述的方法,其特征在于,基于所述访问数据,确定所述向量分量的特征值包括:根据所述访问数据,统计所述目标服务器被访问的端口号以及各个所述端口号的被访问次数;按照被访问次数从大到小的顺序对各个所述端口号进行排序,并筛选出排名前N的N个目标端口号;其中,N为大于或者等于1的整数;确定所述目标端口号的被访问次数在各个所述端口号的被访问次数的总和中的比值;将所述N个目标端口号以及各个所述目标端口号对应的比值作为向量分量的特征值。5.根据权利要求3所述的方法,其特征在于,基于所述访问数据,确定所述向量分量的特征值包括:从所述访问数据中读取与所述目标服务器建立的各条连接的上行流量和下行流量;基于读取的所述上行流量和下行流量,分别确定上行流量统计值和下行流量统计值;其中,所述上行流量统计值中包括上行流量最大值、上行流量最小值、上行流量平均值、上行流量中位数、上行流量标准差中的至少一种;所述下行流量统计值中包括下行流量最大值、下行流量最小值、下行流量平均值、下行流量中位数、下行流量标准差中的至少一种;将所述上行流量统计值和下行流量统计值作为向量分量的特征值。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:从读取的所述上行流量和所述下行流量中分别筛选出数值最大的前M个目标上行流量和前M个目标下行流量,并统计各个所述目标上行流量和目标下行流量分别在上行总流量和下行总流量中的比值;其中,M为大于或者等于1的整数;将各个所述目标上行流量、各个所述目标下行流量、各个所述目标上行流量对应的比值以及各个所述目标下行流量对应的比值作为向量分量的特征值。7.根据权利要求3所述的方法,其特征在于,基于所述访问数据,确定所述向量分量的特征值包括:从所述访问数据中读取与所述目标服务器建立的各条连接的持续时间;基于读取的所述持续时间,确定持续时间统计值;其中,所述持续时间统计值中包括持续时间最大值、持续时间最小值、持续时间平均值、持续时间中位数、持续时间标准差中的至少一种;将所述持续时间统计值作为向量分量的特征值。8.根据权利要求3所述的方法,其特征在于,基于所述访问数据,确定所述向量...

【专利技术属性】
技术研发人员:陈迅
申请(专利权)人:网宿科技股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1