基于机器学习的UPF数据流分类方法、系统、设备及介质技术方案

技术编号:37451327 阅读:26 留言:0更新日期:2023-05-06 09:23
本发明专利技术涉及通信技术领域,公开了一种基于机器学习的UPF数据流分类方法、系统、设备及介质,方法包括获取报文数据并对所述报文数据预处理,得到待识别报文;使用五元组对所述待识别报文进行flow查找和过滤选择,得到加密流量;当根据预先配置的应用快速匹配模型判定所述加密流量匹配时,则将所述加密流量转发到DPI流分类,并进行报文合法性检查;当根据预先配置的应用快速匹配模型判定所述加密流量不匹配时,则提取有关网络流中发生的事件数据;基于预设的AI分类模型和所述事件数据对每个网络流进行推断,得到流分类结果。本方法能够兼顾UPF DPI模块识别加密流量的准确度和性能,能够在面对网络流量大面积加密的情况下提高分类识别的准确率。高分类识别的准确率。高分类识别的准确率。

【技术实现步骤摘要】
基于机器学习的UPF数据流分类方法、系统、设备及介质


[0001]本专利技术涉及通信
,尤其涉及一种基于机器学习的UPF数据流分类方法、系统、设备及介质。

技术介绍

[0002]目前,用户平面功能(User Plane Function,UPF)是3GPP 5G核心网系统架构的重要组成部分,主要负责5G核心网中用户平面数据包的路由和转发相关功能。UPF在5G的边缘计算和网络切片技术中发挥着低延迟和大带宽的重要作用。其中,深度包检测(Deep Packet Inspection,DPI)深度包检测(DPI)是5G核心网用户面功能(UPF)网元中的重要组成部分。UPF通过内嵌的DPI模块对用户访问的具体服务和应用类进行识别和分类,支持安全等功能模块之间的动态策略控制和计费控制。
[0003]传统方式DPI主要通过数据包中模式匹配或查找关键字来对流量进行分类。但是,传统方式仅适用于未加密的流量,对于加密流量无法查看和分析报文载荷当中的信息,无法准确识别流的协议号。此外,对报文进行在线推导需要匹配很多复杂的规则,导致传统方式具有较高的计算本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的UPF数据流分类方法,其特征在于,包括:获取报文数据并对所述报文数据预处理,得到待识别报文;使用五元组对所述待识别报文进行flow查找和过滤选择,得到加密流量;当根据预先配置的应用快速匹配模型判定所述加密流量匹配时,则将所述加密流量转发到DPI流分类,并进行报文合法性检查;当根据预先配置的应用快速匹配模型判定所述加密流量不匹配时,则提取有关网络流中发生的事件数据;基于预设的AI分类模型和所述事件数据对每个网络流进行推断,得到流分类结果。2.根据权利要求1所述的基于机器学习的UPF数据流分类方法,其特征在于,所述AI分类模型的配置过程包括:读取解析PCAP文件,将报文缓存到本地内存当中,并在流表当中创建一条流;提取有关网络流中发生的事件数据,并将所有事件数据更新到所述流表中;其中,所述事件数据包括数据包特征和协议特性;将所述事件数据和相应的标签送入到机器学习框架中,并选取算法模型进行调试,得到AI分类模型。3.根据权利要求2所述的基于机器学习的UPF数据流分类方法,其特征在于,所述应用快速匹配模型的配置过程包括:根据所述流表中的流特征信息和AI分类模型,通过聚类分析选出适合DPI模式匹配的规则,基于所有规则得到并存储应用快速匹配模型。4.根据权利要求1所述的基于机器学习的UPF数据流分类方法,其特征在于,所述使用五元组对所述待识别报文进行flow查找和过滤选择,得到加密流量,包括:若查找flow成功,则根据flow里保存的信息,选择下一步需要执行的操作;若查找flow不成功,则创建一条新的流。5.根据权利要求1所述的基于机器学习的UPF数据流分类方法,其特征在于,所述方法还包括:使用采集到的流转化得到增量训练样本,并结合旧样本和增量训练样本得到新训练样本;根据新训练样本对所述AI分类模型进行训练,...

【专利技术属性】
技术研发人员:张向裕邱涛程通黄强
申请(专利权)人:广州广哈通信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1