一种基于SVM的被动操作系统识别方法、存储介质及设备技术方案

技术编号：26792679 阅读：29 留言：0更新日期：2020-12-22 17:08

本发明专利技术公开了一种基于SVM的被动操作系统识别方法、存储介质及设备，分析p0f指纹库规则，确定训练数据集和测试数据集并进行预处理；将训练数据集和测试数据集由数值变量转换为类别变量，进行OneHot编码；将OneHot编码后的训练数据集构建最优超平面，输入SVM算法模型，采用RBF核函数训映射指纹数据至高维空间，通过计算最优超平面构建SVM分类器，构造特征空间的分类超平面；取OneHot编码后中的测试数据集，经数据预处理后通过SVM算法模型得出预测结果，计算真实流量的测试精度；采集真实流量数据，筛选其中p0f指纹库中缺失的数据，将缺失数据加入训练数据集，重新训练后得到真实流量增量训练后的SVM分类器，完成识别。本发明专利技术优化了操作系统识别的性能，提高了分类精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于SVM的被动操作系统识别方法、存储介质及设备
本专利技术属于计算机
，具体涉及一种基于SVM的被动操作系统识别方法、存储介质及设备。
技术介绍
网络信息安全问题在我国以及全球日趋严峻，并且有持续增长的趋势，已经威胁到人民和国家的利益。在网络安全领域，无论是互联网的攻击还是防护中，对信息的采集和分类都至关重要，这其中远程主机的系统类型通常是黑客们的首要出发点。这是由于某些类型的操作系统有着众所周知的漏洞可以被利用，因此绝大多数的漏洞都是从识别操作系统的类型出发。而网络安全的防护同样需要对主机操作系统类型的识别，以便进行伪造等防护来对用户进行保护。操作系统的类型及版本在其中扮演着举足轻重的地位。因此准确，快速的操作系统识别的研究对网络安全有着重大意义。Medeiros提出利用TCP协议头部的初始序号来识别操作系统，利用了不同操作系统对建立连接时的初始序号生成和增长模式的不同，该方法需要观测大量的数据包(至少100k)，实用性受限，错误率较高。刘英等提出基于TCP/IP协议栈中的TCP选项的操作系统识别方法，...

【技术保护点】
1.一种基于SVM的被动操作系统识别方法，其特征在于，包括以下步骤：/nS1、分析p0f指纹库规则，确定训练数据集和测试数据集；/nS2、对步骤S1确定的训练数据集和测试数据集进行预处理；/nS3、将步骤S2预处理后的训练数据集和测试数据集由数值变量转换为类别变量，再进行OneHot编码；/nS4、采用Gauss核函数，以步骤S3中OneHot编码后的训练数据集构建最优超平面，输入SVM算法模型，采用RBF核函数训映射指纹数据至高维空间，通过计算最优超平面构建SVM分类器，构造特征空间的分类超平面；/nS5、取步骤S3中OneHot编码后中的测试数据集，经数据预处理后通过SVM算法模型得出预测...

【技术特征摘要】
1.一种基于SVM的被动操作系统识别方法，其特征在于，包括以下步骤：
S1、分析p0f指纹库规则，确定训练数据集和测试数据集；
S2、对步骤S1确定的训练数据集和测试数据集进行预处理；
S3、将步骤S2预处理后的训练数据集和测试数据集由数值变量转换为类别变量，再进行OneHot编码；
S4、采用Gauss核函数，以步骤S3中OneHot编码后的训练数据集构建最优超平面，输入SVM算法模型，采用RBF核函数训映射指纹数据至高维空间，通过计算最优超平面构建SVM分类器，构造特征空间的分类超平面；
S5、取步骤S3中OneHot编码后中的测试数据集，经数据预处理后通过SVM算法模型得出预测结果，计算真实流量的测试精度；
S6、采集步骤S5的真实流量数据，然后经步骤S2和S3处理后，筛选其中p0f指纹库中缺失的数据，将缺失数据加入训练数据集，经步骤S4重新训练后，得到真实流量增量训练后的SVM分类器，通过SVM分类器完成识别。

2.根据权利要求1所述的基于SVM的被动操作系统识别方法，其特征在于，步骤S1中，选取指纹库的特定字段N维并筛选适用现阶段网络环境的指纹数据，加上操作系统类别标记后作为训练数据集；通过流量采集工具在互联网网关分时段采集真实流量数据包，存储为.pcap格式作为测试数据集。

3.根据权利要求1...

【专利技术属性】
技术研发人员：范建存，陈浩男，罗新民，
申请(专利权)人：西安交通大学，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人