当前位置: 首页 > 专利查询>中国移动浙江创新研究院有限公司中国移动通信集团有限公司专利>正文

流量分类系统、模型训练方法、设备和存储介质技术方案

技术编号：39270966 阅读：8 留言：0更新日期：2023-11-07 10:50

本发明专利技术公开了一种流量分类系统、模型训练方法、设备和存储介质，所述方法包括：获取用于模型训练的网络流量序列数据，和所述网络流量序列数据中的每一网络流所属类别；根据每个所述类别对应的样本数量确定所述类别对应的损失函数；根据所述损失函数和所述网络流量序列数据对预设的神经网络模型进行训练，得到网络流量分类模型，所述神经网络模型由编码器、卷积神经网络和分类器组成。本发明专利技术训练得到的网络流量分类模型更加准确。络流量分类模型更加准确。络流量分类模型更加准确。

全部详细技术资料下载

【技术实现步骤摘要】
流量分类系统、模型训练方法、设备和存储介质

[0001]本专利技术涉及计算机
，尤其涉及一种流量分类系统、模型训练方法、设备和存储介质。

技术介绍

[0002]互联网的快速发展过程中出现了大量的应用和服务，并带来了海量的网络流量数据，这些庞大且复杂的数据导致网络管理的复杂化。需要根据不同类型流量的使用情况来进行网络资源调度，实现带宽资源的合理利用，为用户提供良好的网络服务。然而不同类别的网络流量数据量差异巨大，数据不平衡问题会严重影响分类效果。目前，解决类别不平衡问题是对数据集进行采样，使数据集重新趋于平衡。数据采样技术主要分为欠采样和过采样两种，欠采样通过选择一部分多数类样本丢弃使各类别样本达到平衡，过采样方法通过生成新的少数类别样本来使数据集重新达到类别平衡，但是数据的丢弃或者生成会引入误差，导致模型训练出现误差。

技术实现思路

[0003]本专利技术的主要目的在于提供一种流量分类系统、模型训练方法、设备和存储介质，旨在解决如何提高模型训练的准确率的问题。
[0004]为实现上述目的，本专利技术提供的一种流量分类系统，所述流量分类系统包括：
[0005]编码器，用于提取网络流量序列数据的时序特征；
[0006]卷积神经网络，所述卷积神经网络与所述编码器连接，用于提取所述网络流量序列数据的空间特征；
[0007]分类器，用于根据所述时序特征和空间特征，确定所述网络流量序列数据中的每一网络流所属的类别，以及所述网络流属于所述类别的概率值；
[0008]损失...

【技术保护点】

【技术特征摘要】
1.一种流量分类系统，其特征在于，所述流量分类系统包括：编码器，用于提取网络流量序列数据的时序特征；卷积神经网络，所述卷积神经网络与所述编码器连接，用于提取所述网络流量序列数据的空间特征；分类器，用于根据所述时序特征和空间特征，确定所述网络流量序列数据中的每一网络流所属的类别，以及所述网络流属于所述类别的概率值；损失值平衡模块，用于根据所述概率值以及所述类别对应的类别权重，确定流量分类系统的损失值，并根据预设的反向传播算法和所述损失值更新所述编码器和所述卷积神经网络的参数，所述类别权重由所述类别的样本数量确定。2.如权利要求1所述的流量分类系统，其特征在于，所述卷积神经网络包括卷积层、池化层和全连接层，所述卷积层和所述池化层用于提取多维度的空间特征，所述全连接层与分类器连接，所述全连接层用于将多纬度的空间特征转换为预设维度的空间特征，所述预设维度由类别的数量确定。3.一种模型训练方法，其特征在于，应用于如权利要求1
‑
2中任一项所述的流量分类系统，所述模型训练方法包括：获取用于模型训练的网络流量序列数据，以及所述网络流量序列数据中的每一网络流所属类别；根据每个所述类别对应的样本数量确定所述类别对应的损失函数；根据所述损失函数和所述网络流量序列数据对预设的神经网络模型进行训练，得到网络流量分类模型，所述神经网络模型由编码器、卷积神经网络和分类器组成。4.如权利要求3所述的模型训练方法，其特征在于，所述根据每个所述类别对应的样本数量确定所述类别对应的损失函数的步骤包括：根据预设的平滑系数、所述类别对应的样本数量和样本总数确定平滑处理后的网络流；根据所述平滑处理后的网络流确定类别权重；根据所述类别权重确定所述损失函数。5.如权利要求3所述的模型训练方法，其特征在于，所述获取用于模型训练的网络流量序列数据的步骤包括：获取每一所述网络流中按照时间排序的多个数据包；根据预设数量的...

【专利技术属性】
技术研发人员：宋明泽，刘聪，蒋健，王晓征，
申请(专利权)人：中国移动浙江创新研究院有限公司中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人