【技术实现步骤摘要】
基于机器学习的UPF数据流分类方法、系统、设备及介质
[0001]本专利技术涉及通信
,尤其涉及一种基于机器学习的UPF数据流分类方法、系统、设备及介质。
技术介绍
[0002]目前,用户平面功能(User Plane Function,UPF)是3GPP 5G核心网系统架构的重要组成部分,主要负责5G核心网中用户平面数据包的路由和转发相关功能。UPF在5G的边缘计算和网络切片技术中发挥着低延迟和大带宽的重要作用。其中,深度包检测(Deep Packet Inspection,DPI)深度包检测(DPI)是5G核心网用户面功能(UPF)网元中的重要组成部分。UPF通过内嵌的DPI模块对用户访问的具体服务和应用类进行识别和分类,支持安全等功能模块之间的动态策略控制和计费控制。
[0003]传统方式DPI主要通过数据包中模式匹配或查找关键字来对流量进行分类。但是,传统方式仅适用于未加密的流量,对于加密流量无法查看和分析报文载荷当中的信息,无法准确识别流的协议号。此外,对报文进行在线推导需要匹配很多复杂的规则,导致传 ...
【技术保护点】
【技术特征摘要】
1.一种基于机器学习的UPF数据流分类方法,其特征在于,包括:获取报文数据并对所述报文数据预处理,得到待识别报文;使用五元组对所述待识别报文进行flow查找和过滤选择,得到加密流量;当根据预先配置的应用快速匹配模型判定所述加密流量匹配时,则将所述加密流量转发到DPI流分类,并进行报文合法性检查;当根据预先配置的应用快速匹配模型判定所述加密流量不匹配时,则提取有关网络流中发生的事件数据;基于预设的AI分类模型和所述事件数据对每个网络流进行推断,得到流分类结果。2.根据权利要求1所述的基于机器学习的UPF数据流分类方法,其特征在于,所述AI分类模型的配置过程包括:读取解析PCAP文件,将报文缓存到本地内存当中,并在流表当中创建一条流;提取有关网络流中发生的事件数据,并将所有事件数据更新到所述流表中;其中,所述事件数据包括数据包特征和协议特性;将所述事件数据和相应的标签送入到机器学习框架中,并选取算法模型进行调试,得到AI分类模型。3.根据权利要求2所述的基于机器学习的UPF数据流分类方法,其特征在于,所述应用快速匹配模型的配置过程包括:根据所述流表中的流特征信息和AI分类模型,通过聚类分析选出适合DPI模式匹配的规则,基于所有规则得到并存储应用快速匹配模型。4.根据权利要求1所述的基于机器学习的UPF数据流分类方法,其特征在于,所述使用五元组对所述待识别报文进行flow查找和过滤选择,得到加密流量,包括:若查找flow成功,则根据flow里保存的信息,选择下一步需要执行的操作;若查找flow不成功,则创建一条新的流。5.根据权利要求1所述的基于机器学习的UPF数据流分类方法,其特征在于,所述方法还包括:使用采集到的流转化得到增量训练样本,并结合旧样本和增量训练样本得到新训练样本;根据新训练样本对所述AI分类模型进行训练,...
【专利技术属性】
技术研发人员:张向裕,邱涛,程通,黄强,
申请(专利权)人:广州广哈通信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。