基于软边缘三元组损失函数的孪生网络未知流量识别方法技术

技术编号:37303619 阅读:30 留言:0更新日期:2023-04-21 22:48
本发明专利技术公开了一种基于软边缘三元组损失函数的孪生网络未知流量识别方法,包括:构建孪生网络训练需求的三元组数据集合,采用随机构建的方式,通过多轮迭代,形成多种组合的三元组训练数据集;在模型训练阶段,软边界三元组损失函数指导模型训练,训练完成后的孪生网络单独作为编码器;使用编码器将被测试样本与所有已知流量数据样本编码;计算被测试样本与已知流量应用的距离,通过与预设阈值比较判定其是否属于未知样本;将判定为未知流量的样本通过相似度聚类,形成纯度更高的堆簇;根据簇纯度决定最佳分簇数量,最终进行细粒度分析。本发明专利技术解决了传统无监督聚类方案与深度学习方案在未知流量识别领域的聚类数量不明确、维护模型过多等问题。护模型过多等问题。护模型过多等问题。

【技术实现步骤摘要】
基于软边缘三元组损失函数的孪生网络未知流量识别方法


[0001]本专利技术涉及网络人工智能、未知流量识别、未知流量聚类
,尤其涉及基于软边缘三元组损失函数的孪生网络未知流量识别方法。

技术介绍

[0002]未知流量识别对于网络安全管理和网络资源优化十分重要,运营商或网络管理员可以识别潜在的未知恶意流量或者网络攻击;同时可以对识别出的流量进行细粒度的网络资源分配与动态智能化调配,以支持网络切片业务、可定制化网络服务等业务的发展。因此实现细粒度的未知流量识别能够促进网络资源高效率利用、降低网络能耗、降低网络安全潜在风险。
[0003]未知网络流量识别主要包括未知流量检测和未知流量聚类两个阶段。前者确保未知的应用流量能够被检测到,以一定的置信率与已知种类区分,避免未知流量与已知种类混淆,从而导致一些隐匿性安全风险或者阻碍具有针对性的网络资源优化;后者则确保已经被识别出来的未知流量根据其相似度聚类成纯度更高的簇,以引入专家系统(指具有流量识别背景知识的技术人员,在传统技术或者人工智能技术辅助下组成的专业系统,以进一步提高识别的准确度)、深本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于软边缘三元组损失函数的孪生网络未知流量识别方法,其特征在于,包括以下步骤:构建孪生网络模型训练需求的三元组数据集合,采用随机构建的方式,通过多轮迭代,形成多种组合的三元组训练数据集;在孪生网络模型训练阶段,软边界三元组损失函数指导孪生网络模型训练,训练完成后的孪生网络单独作为编码器;使用编码器将被测试样本与所有已知流量数据样本编码;计算被测试样本与已知流量应用的距离,通过与预设阈值比较判定其是否属于未知样本;将判定为未知流量的样本通过相似度聚类,形成纯度更高的堆簇;根据簇纯度决定最佳分簇数量,最终引入专家系统进行细粒度分析。2.根据权利要求1所述的方法,其特征在于,训练三元组的数据集构造作为孪生网络模型训练的输入,孪生网络模型在损失函数的指导下学习三元组数据信息,优化孪生网络模型。3.根据权利要求2所述的方法,其特征在于,所述三元组构造步骤包括:步骤一、对于任意一个已知流量的数据样本x
a
,随机从其同类别流量样本中选取与其不同的样本x
p
,从其不同类别的所有流量样本中随机选取x
n
,构造成一个三元组(x
a
,x
p
,x
n
);步骤二、对所有的已知流量样本,重复步骤一的操作;步骤三、设定迭代次数E,将步骤一和步骤二迭代E次,以产生不同组合的三元组训练数据。4.根据权利要求1所述的方法,其特征在于,所述训练过程主要包含软边界三元组损失函数设计,损失函数定义为:其中,(x
a
,x
p
,x
n
)代表一个输入三元组,(x
a
...

【专利技术属性】
技术研发人员:徐陆阳宋俊平曹江周旭高原覃毅芳任勇毛
申请(专利权)人:中国科学院计算机网络信息中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1