一种基于多协议混合场景的未知协议聚类方法和系统技术方案

技术编号：35787829 阅读：18 留言：0更新日期：2022-12-01 14:35

本发明专利技术公开了一种基于多协议混合场景的未知协议聚类方法和系统，所述方法包括：获取待处理的未知协议的流量数据；利用特征工程将所述流量数据转换为灰度图片；基于预先训练的特征提取模型，对所述灰度图片进行特征提取，以得到特征向量；基于预存的聚类算法对所述特征向量进行聚类，以得到聚类结果；其中，所述特征提取模型是根据已知协议样本转换得到的灰度图片样本进行训练得到的。解决了现有技术中在多协议混合场景下，未知协议聚类准确性较差、效率较低的问题。效率较低的问题。效率较低的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多协议混合场景的未知协议聚类方法和系统

[0001]本专利技术涉及网络信息
，具体涉及一种基于多协议混合场景的未知协议聚类方法和系统。

技术介绍

[0002]网络信息安全与对抗已成为信息时代备受关注的重要问题。在电子对抗等领域，通信双方使用的协议往往是订制的、非公开的，所截获的通信数据大多是连续的比特流信息；在网络监管等领域，网络通信过程中使用的协议解析工具也会遇到许多无法解析的比特流协议。对于这些协议，协议分析者没有任何先验知识，聚类解析这些完全未知的协议十分困难。
[0003]在现有技术中，通常利用指纹特征的数据帧定界方法或者基于关联规则对特定环境下的未知协议进行聚类分析。这些方法都能在相应的设定条件下取得较好的效果，能为识别未知协议提供有用的参考，但它们均是在单协议假定下进行分析，在实际应用环境下，捕获得到的未知协议数据往往是多种协议混合的，无法通过上述方式实现未知协议的快速聚类。

技术实现思路

[0004]为此，本专利技术实施例提供一种基于多协议混合场景的未知协议聚类方法和系统，以至少部分解决现有技术中在多协议混合场景下，未知协议聚类准确性较差、效率较低的问题。
[0005]为了实现上述目的，本专利技术实施例提供如下技术方案：
[0006]本专利技术提供一种基于多协议混合场景的未知协议聚类方法，所述方法包括：
[0007]获取待处理的未知协议的流量数据；
[0008]利用特征工程将所述流量数据转换为灰度图片；
[0009]基于预先训...

【技术保护点】

【技术特征摘要】
1.一种基于多协议混合场景的未知协议聚类方法，其特征在于，所述方法包括：获取待处理的未知协议的流量数据；利用特征工程将所述流量数据转换为灰度图片；基于预先训练的特征提取模型，对所述灰度图片进行特征提取，以得到特征向量；基于预存的聚类算法对所述特征向量进行聚类，以得到聚类结果；其中，所述特征提取模型是根据已知协议样本转换得到的灰度图片样本进行训练得到的。2.根据权利要求1所述的基于多协议混合场景的未知协议聚类方法，其特征在于，利用特征工程将所述流量数据转换为灰度图片，具体包括：对所述流量数据进行清洗，以得到有效数据；将所述有效数据根据五元组信息划分为多个会话；将各所述会话的数据包长度进行统一，并将每个所述会话的数据包形成二维矩阵；将所述二维矩阵转换为灰度图片。3.根据权利要求2所述的基于多协议混合场景的未知协议聚类方法，其特征在于，训练所述特征提取模型，具体包括：将已知协议样本转换得到的灰度图片样本进行数据增强处理，以得到增强图片样本；将所述增强图像样本输入到神经网络结构中进行训练，得到初始模型；对所述初始模型进行迭代优化，并在达到预设收敛值时停止迭代，以得到所述特征提取模型。4.根据权利要求3所述的基于多协议混合场景的未知协议聚类方法，其特征在于，将已知协议样本转换得到的灰度图片样本进行数据增强处理，以得到增强图片样本，具体包括：对所述灰度图片样本依次进行随机裁剪到、随机旋转、随机水平翻转、中心裁剪、转化成张量和正规化处理，以得到数据增强处理后的增强图像样...

【专利技术属性】
技术研发人员：任玉坤，李丹丹，
申请(专利权)人：北京观成科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人