当前位置: 首页 > 专利查询>天津大学专利>正文

一种跨多种协议和协议组合的自动化加密流量分析方法技术

技术编号:37781326 阅读:38 留言:0更新日期:2023-06-09 09:11
本发明专利技术公开了一种跨多种协议和协议组合的自动化加密流量分析方法,步骤1,将待分类的加密网络应用程序的网络流量进行预处理,得到网络流量数据包;步骤2,获得当前网络流量数据包的语义表示,进行当前网络流量数据包的特征提取;步骤3,构造包含1088个特征的固定长度网络数据包特征向量;步骤4,网络数据包特征导出;步骤5,寻找最优分析模型,选取表现最优的分类模型。与现有技术相比,本发明专利技术将机器学习应用于网络流量分析的方法,支持跨多种网络协议和多种网络协议的组合,并支持自定义字段扩展方法。展方法。展方法。

【技术实现步骤摘要】
一种跨多种协议和协议组合的自动化加密流量分析方法


[0001]本专利技术涉及计算机网络和加密网络流量
,特别是涉及一种跨多种协议和协议组合的自动化加密流量分析方法。

技术介绍

[0002]网络安全中的许多流量分类任务都依赖于机器学习。尽管当前的研究已经非常关注应用于这些任务的机器学习模型以及这些模型的性能,但在实践中,这些任务严重依赖于涉及手动抽取特征以及选择和调整模型管道。特征抽取、模型和模型参数的适当组合通常是一个迭代化过程。事实上将机器学习应用于网络流量分析任务的有效性通常取决于模型本身的特征适当的选择和表示,但这部分过程仍需要大量手工操作并对相关技术人员有着严苛要求。特征抽取任务抽取和模型选择是一个繁复的过程,通常需要相关技术人员运用大量的专业领域知识来设计相关特征,这些特征既可用于测量或派生,又能产生准确的模型。即使技术人员拥有非常专业领域知识,特征探索和抽取在很大程度上仍然是一个低鲁棒性且容易出现失误的过程,因为特征的选择以及如何表示它们会极大地影响模型的准确性。这种手动提取方式可能会忽略潜在或涉及复杂关系(例如,特征之间的非本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种跨多种协议和协议组合的自动化加密流量分析方法,其特征在于,该方法包括以下步骤:步骤1,将待分类的加密应用程序的网络流量进行预处理,得到网络流量中每个网络流的数据包,具体操作包括:将多个原始网络流量pcap文件根据五元组信息包括源IP地址、目的IP地址、源端口、目的端口和协议,进行网络流量中的网络流划分,得到多个带标签的网络流量数据包,作为步骤2的输入;步骤2,获得当前网络流量数据包的语义表示,进行当前网络流量数据包的特征提取,具体包括以下处理:步骤2.1,提取网络数据包的全部IP协议数据包头信息,包括但不限于IP协议号、IP协议选项字段、源IP协议地址和目的IP协议地址;步骤2.2,提取TCP协议数据包头和UDP协议数据包头的全部特征信息,包括但不限于源端口号和目的端口号;步骤2.3,提取ICMP协议数据包头的部信息;步骤3,获得网络数据包特征的二进制表示,构造包含1088个特征的固定长度网络数据包特征向量,具体包括以下步骤:步骤3.1,将IP协议数据包头的60字节特征全部映射成480个IP协议数据包头特征,每个IP协议数据包头特征分别对应IP协议数据包头的每个字节内的位置信息,将每个字节用8位的二进制表示,每个位置的0和1数值对应到IP协议数据包头的480个特征;步骤3.2,将TCP协议数据包头的60字节特征全部映射成480个TCP协议数据包头特征,每个TCP头特征分别对应TCP协议数据包头的每个字节内的位置信息,将每个字节用8位的二进制表示,每个位置的0和1数值对应到TCP协议数据包头的480个特征;步骤3.3,将UDP协议数据包头的8字节特征全部映射成64个UDP数据包头特征,每个UDP...

【专利技术属性】
技术研发人员:孙林檀张虎郝景昌李晓红陈森李慧芹张烁王蕾
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1