训练流量分类模型制造技术

技术编号:39843630 阅读:20 留言:0更新日期:2023-12-29 16:34
本申请实施例提供一种训练流量分类模型

【技术实现步骤摘要】
训练流量分类模型、流量数据分类的方法、装置及介质


[0001]本申请实施例涉及流量数据分类领域,具体涉及一种训练流量分类模型

流量数据分类的方法

装置及介质


技术介绍

[0002]相关技术中,基于机器学习的流量分类已经成为了热门的研究方向,但是由于隐私及安全问题,目前网络传输大多使用流量伪装

虚拟隧道等技术,某些特定领域或任务的带标签流量数据不易获取,只有少量且不平衡的样本可供模型进行学习

使用不平衡的小样本流量数据直接对模型训练,容易导致模型在识别的过程中偏向识别小样本流量数据中包括的类别的数据,对于其他类别的数据识别准确率较低,降低了模型分类性能

[0003]因此,如何提高流量分类的准确性成为需要解决的问题


技术实现思路

[0004]本申请实施例提供一种训练流量分类模型

流量数据分类的方法

装置及介质,通过本申请的一些实施例至少能够解决小样本数据集不平衡的问题,从本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种训练流量分类模型的方法,其特征在于,所述方法包括:通过通用流量数据集对待训练的流量分类模型进行预训练,获得预训练流量分类模型;将所述预训练流量分类模型中的部分网络层进行冻结,保留所述预训练流量分类模型中的参数,获得调整后的流量分类模型;通过小样本流量数据集对所述调整后的流量分类模型进行训练,获得目标流量分类模型,其中,所述目标流量分类模型中所述部分网络层中的参数与所述预训练流量分类模型中相应的网络层的参数相同
。2.
根据权利要求1所述的方法,其特征在于,在所述通过小样本流量数据集对所述调整后的流量分类模型进行训练,获得目标流量分类模型之前,所述方法还包括:通过所述调整后的流量分类模型中的超参数
β
确定所述小样本流量数据集中的有效样本数
E
ti
,其中,所述超参数
β
的取值范围为
[0,1)
;通过所述有效样本数
E
ti
调整有效样本权重
w
i
;通过所述有效样本权重
w
i
调整所述调整后的流量分类模型中输出层的损失函数
。3.
根据权利要求2所述的方法,其特征在于,所述通过所述有效样本数
E
ti
调整有效样本权重
w
i
,包括:将所述有效样本权重
w
i
设置为所述有效样本数
E
ti
的倒数
。4.
根据权利要求1‑3任一项所述的方法,其特征在于,所述预训练流量分类模型包括多个卷积层和多个全连接层;所述将所述预训练流量分类模型中的部分网络层进行冻结,包括:将所述预训练流量分类模型中的所述多个卷积层以及所述多个全连接层中除最后一个全连接层之外的所有全连接层冻结
。5.
一种流量数据分类的方法,其特征在于,所述方法包括:获取待分类流量数据;通过如权利要求1‑4任一项所述的方法得到的目标流量分类模型对所述待分类流量数据进行分类,获得分类结果
。6.
一种训练流量分类模型的装置,其特征在于,所述装置包括:预训练模块,被配置为通过通用流量数据集对待训练的流量分类模型进行预训练,获得预训练流量分类模...

【专利技术属性】
技术研发人员:梁靖宇胡晓艳安晓宁
申请(专利权)人:北京天融信网络安全技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1