一种网络流量识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39275261 阅读:5 留言:0更新日期:2023-11-07 10:52
本申请公开了一种网络流量识别方法、装置、电子设备及存储介质,属于互联网技术领域。所述方法包括:根据第一样本数据,确定第一流量模型,其中,所述第一样本数据包括多条离线流量数据和每条所述离线流量数据对应的流量标签数据,所述第一流量模型包括编码网络和分类网络;根据第二样本数据,确定第二流量模型,其中,所述第二样本数据包括预定时间内的多条实时流量数据,所述第二流量模型的结构与所述编码网络的结构相同,所述第二流量模型的初始权值与所述编码网络的权值相同;根据所述第二流量模型,对所述第一流量模型进行调整;基于所述调整后的第一流量模型,对所述第一样本数据进行分类。据进行分类。据进行分类。

【技术实现步骤摘要】
一种网络流量识别方法、装置、电子设备及存储介质


[0001]本申请属于互联网
,具体涉及一种网络流量识别方法、装置、电子设备及存储介质。

技术介绍

[0002]随着互联网的发展,网络流量识别面临诸多挑战:流量种类越来越复杂,更新频率越来越快,加密程度越来越高。传统基于规则的网络流量识别技术如深度报文检测(Deep Packet Inspection,DPI),需要长期人工投入来手动提取流量特征,效率与准确率都不高。
[0003]相关基于机器学习(Machine Learning,ML)的流量识别技术,一般是在收集带有标签的监督学习流量样本后,构造机器学习模型提取流量的行为特征,如包长与传包间隔等,来实现流量分类,但其模型训练使用的流量样本通常是离线的,与在线推理使用时遇到的流量情况通常会存在差异,导致其分类能力完全依赖于线下监督样本的收集,识别准确率也不高。

技术实现思路

[0004]本申请实施例提供一种网络流量识别方法、装置、电子设备及存储介质,能够适应推理环境下的实际流量分布,提高流量识别的准确率。
[0005]第一方面,本申请实施例提供了一种网络流量识别方法,包括:根据第一样本数据,确定第一流量模型,其中,所述第一样本数据包括多条离线流量数据和每条所述离线流量数据对应的流量标签数据,所述第一流量模型包括编码网络和分类网络,所述编码网络用于对所述第一样本数据进行编码,所述分类网络用于对编码后的所述第一样本数据进行分类;根据第二样本数据,确定第二流量模型,其中,所述第二样本数据包括预定时间内的多条实时流量数据,所述第二流量模型的结构与所述编码网络的结构相同,所述第二流量模型的初始权值与所述编码网络的权值相同;根据所述第二流量模型,对所述第一流量模型进行调整;基于所述调整后的第一流量模型,对所述第一样本数据进行分类。
[0006]第二方面,本申请实施例提供了一种网络流量识别装置,包括:离线训练模块,用于根据第一样本数据,确定第一流量模型,其中,所述第一样本数据包括多条离线流量数据和每条所述离线流量数据对应的流量标签数据,所述第一流量模型包括编码网络和分类网络,所述编码网络用于对所述第一样本数据进行编码,所述分类网络用于对编码后的所述第一样本数据进行分类;在线学习模块,用于根据第二样本数据,确定第二流量模型,其中,所述第二样本数据包括预定时间内的多条实时流量数据,所述第二流量模型的结构与所述编码网络的结构相同,所述第二流量模型的初始权值与所述编码网络的权值相同;调整模块,用于根据所述第二流量模型,对所述第一流量模型进行调整;分类模块,用于基于所述调整后的第一流量模型,对所述第一样本数据进行分类。
[0007]第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理
器执行时实现如第一方面所述的网络流量识别方法的步骤。
[0008]第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的网络流量识别方法的步骤。
[0009]第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的网络流量识别方法的步骤。
[0010]在本申请实施例中,通过根据第一样本数据,确定第一流量模型,其中,所述第一样本数据包括多条离线流量数据和每条所述离线流量数据对应的流量标签数据,所述第一流量模型包括编码网络和分类网络,所述编码网络用于对所述第一样本数据进行编码,所述分类网络用于对编码后的所述第一样本数据进行分类;根据第二样本数据,确定第二流量模型,其中,所述第二样本数据包括预定时间内的多条实时流量数据,所述第二流量模型的结构与所述编码网络的结构相同,所述第二流量模型的初始权值与所述编码网络的权值相同;根据所述第二流量模型,对所述第一流量模型进行调整;基于所述调整后的第一流量模型,对所述第一样本数据进行分类,能够适应推理环境下的实际流量分布,提高流量识别的准确率。
附图说明
[0011]图1是本申请实施例提供的一种网络流量识别方法的流程示意图;
[0012]图2是本申请实施例提供的另一种网络流量识别方法的流程示意图;
[0013]图3是本申请实施例提供的一种多通道文本输入构造方法的示例图;
[0014]图4是本申请实施例提供的一种Text

CNN的网络结构示例图;
[0015]图5是本申请实施例提供的一种多通道组卷积的示例图;
[0016]图6是本申请实施例提供的一种离线模型引入实时自优化流程的示例图
[0017]图7是本申请实施例提供的一种模型迭代自优化的流程示意图;
[0018]图8是本申请实施例提供的一种业务流量动作级识别方法的流程示意图;
[0019]图9是本申请实施例提供的一种全量流量识别方法的流程示意图;
[0020]图10是本申请实施例提供的一种网络流量识别装置的结构示意图;
[0021]图11是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0022]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0023]本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可
以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
[0024]下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的一种身份验证方法、装置、电子设备及存储介质进行详细地说明。
[0025]图1示出本申请的一个实施例提供的一种网络流量识别方法,该方法可以由电子设备执行,该电子设备可以包括:服务器和/或终端设备。换言之,该方法可以由安装在该电子设备的软件或硬件来执行,该方法包括如下步骤:
[0026]S102:根据第一样本数据,确定第一流量模型。
[0027]其中,所述第一样本数据包括多条离线流量数据和每条所述离线流量数据对应的流量标签数据,所述第一流量模型包括编码网络和分类网络,所述编码网络用于对所述第一样本数据进行编码,所述分类网络用于对编码后的所述第一样本数据进行分类。
[0028]本步骤属于离线训练分类模型以进行流本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网络流量识别方法,其特征在于,所述方法包括:根据第一样本数据,确定第一流量模型,其中,所述第一样本数据包括多条离线流量数据和每条所述离线流量数据对应的流量标签数据,所述第一流量模型包括编码网络和分类网络,所述编码网络用于对所述第一样本数据进行编码,所述分类网络用于对编码后的所述第一样本数据进行分类;根据第二样本数据,确定第二流量模型,其中,所述第二样本数据包括预定时间内的多条实时流量数据,所述第二流量模型的结构与所述编码网络的结构相同,所述第二流量模型的初始权值与所述编码网络的权值相同;根据所述第二流量模型,对所述第一流量模型进行调整;基于所述调整后的第一流量模型,对所述第一样本数据进行分类。2.根据权利要求1所述的方法,其特征在于,在所述根据所述第二流量模型,对所述第一流量模型进行调整之前,所述方法还包括:将所述第一流量模型的编码网络的权值确定为第一初始权值;所述根据所述第二流量模型,对所述第一流量模型进行调整,包括:将所述第一流量模型的编码网络的权值设置为所述第二流量模型对应的权值。3.根据权利要求2所述的方法,其特征在于,在所述基于所述调整后的第一流量模型,对所述第一样本数据进行分类之后,所述方法还包括:对分类结果进行统计,确定所述调整后的第一流量模型的第二分类准确率;将所述第二分类准确率与调整前的所述第一流量模型的第一分类准确率比较,在所述第二分类准确率与所述第一分类准确率的差值不大于预设阈值的情况下,将所述第一流量模型的编码网络的权值设置为所述第一初始值;重复执行如下步骤,直到所述第一流量模型的编码网络的权值连续n次不变,其中,n为大于0的整数:根据第二样本数据,确定第二流量模型,其中,所述第二样本数据包括预定时间内的多条实时流量数据,所述第二流量模型的结构与所述编码网络的结构相同,所述第二流量模型的初始权值与所述编码网络的权值相同;根据所述第二流量模型,对所述第一流量模型进行调整;基于所述调整后的第一流量模型,对所述第一样本数据进行分类;对分类结果进行统计,确定所述调整后的第一流量模型的第二分类准确率;将所述第二分类准确率与调整前的所述第一流量模型的第一分类准确率比较,在所述第二分类准确率与所述第一分类准确率的差值不大于预设阈值的情况下,将所述第一流量模型的编码网络的权值设置为所述第一初始值。4.根据权利要求1所述的方法,其特征在于,在所述根据第一样本数据...

【专利技术属性】
技术研发人员:李茂桂
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1