【技术实现步骤摘要】
一种基于包长度序列和消息长度序列深度融合的物联网流量分类方法及系统
[0001]本专利技术涉及一种基于包长度序列和消息长度序列深度融合的物联网流量分类方法及系统。
技术介绍
[0002]在当今时代,为了提供优质的物联网服务质量,运营商需要进行合理的物联网规划管理。具体而言,他们需要确定物联网设备的流量来源,以便提供相应的设备服务。在家庭中,智能家居需要收集各种数据信息,上传并分析这些数据,以区分不同类型的设备,分析设备使用习惯,以提供更好的服务。此外,还需要检测异常数据,以避免恶意的数据攻击。因此,物联网流量分类是物联网服务优化和异常检测的前提条件。
[0003]多年来,科研人员对该领域进行了深入的探索,并提出了许多解决方案。深度数据报文检测(DPI)是过去的重要流量分类技术之一。在过去的十年中,各个研发团队探索了多种网络流量分类方法。近年来,计算机视觉、机器翻译和语音识别等多个深度学习
的成功,极大地推动了流量分类的发展。因此,大量从事该工作的研究人员开始使用先进的深度学习技术来解决网络流量分类的各种问题。< ...
【技术保护点】
【技术特征摘要】
1.一种基于包长度序列和消息长度序列深度融合的物联网流量分类方法,其特征在于,该方法包括物联网流量分类模型构建阶段和物联网流量分类阶段;所述物联网流量分类模型构建阶段包括如下步骤:1)以与标签绑定的原始物联网流量样本作为输入,进行物联网流量预处理操作,得到物联网流量样本的包长度序列和消息长度序列;2)以步骤1)得到的物联网流量样本的包长度序列和消息长度序列作为输入,进行嵌入向量表示处理操作,得到物联网流量样本的包长度序列和消息长度序列的嵌入向量表示形式;3)以步骤2)得到的物联网流量样本的包长度序列和消息长度序列的嵌入向量表示形式作为输入,对该输入进行特征提取操作,得到物联网流量样本的包长度序列特征和消息长度序列特征;4)以步骤3)得到的物联网流量样本的包长度序列特征和消息长度序列特征作为输入特征,对该输入特征进行分类,得到物联网流量样本的预测结果,并将预测结果与已知标签作比较,计算损失函数得到损失值;5)重复步骤1)
‑
步骤4),直至达到终止条件,得到物联网流量分类模型;所述物联网流量分类阶段包括如下步骤:6)以待分类的物联网流量作为输入,对其进行物联网流量预处理操作,得到物联网流量的包长度序列和消息长度序列;7)以步骤6)得到的物联网流量包长度序列和消息长度序列作为输入,利用步骤5)得到的物联网流量分类模型对其进行分类,得到待分类物联网流量的分类结果。2.如权利要求1所述的基于包长度序列和消息长度序列深度融合的物联网流量分类方法,其特征在于,步骤1)所述进行物联网流量预处理的具体操作方法如下:1
‑
1)对输入的原始物联网流量,进行重组操作得到物联网流;1
‑
2)以步骤1
‑
1)得到的物联网流作为输入,进行流序列的提取操作,得到物联网流量流序列;该提取操作中提取的流序列包括包长度序列和消息长度序列;1
‑
3)以步骤1
‑
2)得到的物联网流量流序列作为输入,进行物联网流量包长度序列和消息长度序列的长度调整操作,得到物联网流量样本的包长度序列和消息长度序列。3.如权利要求1所述的基于包长度序列和消息长度序列深度融合的物联网流量分类方法,其特征在于,步骤2)所述对物联网流量样本的包长度序列和消息长度序列进行嵌入向量表示处理的具体操作方法是:2
‑
1)以步骤1)得到的物联网流量样本的包长度序列和消息长度序列作为输入,统计其中包长度和消息长度的总数量并对包长度序列中的包长度和消息长度序列中的消息长度编码;2
‑
2)以步骤2
‑
1)得到的物联网流量样本中包长度和消息长度的总共数量以及编码后得到的物联网流量样本的包长度序列和消息长度序列作为输入,进行该步骤输入的嵌入向量表示处理操作,得到物联网流量样本的包长度序列和消息长度序列的嵌入向量表示形式。4.如权利要求3所述的基于包长度序列和消息长度序列深度融合的物联网流量分类方法,其特征在于,步骤3)所述对物联网流量样本的包长度序列和消息长度序列的嵌入向量
进行特征提取的具体操作方法如下:3
‑
1)以步骤2
‑
2)得到的物联网流量样本的包长度序列和消息长度序列的嵌入向量表示形式作为输入,利用包长度
‑
消息长度序列特征构建层,进行特征提取操作,得到物联网流量样本的包长度序列特征和消息长度序列特征;3
‑
2)以步骤3
‑
1)得到的物联网流量样本的包长度序列特征和消息长度序列特征作为输入,对每个物联网流量样本的包长度序列特征和消息长度序列特征分别在特征维度上进行拼接,得到拼接后的物联网流量样本的包长度序列特征和消息长度序列特征。5.如权利要求4所述的基于包长度序列和消息长度序列深度融合的物联网流量分类方法,其特征在于,步骤4)所述对输入的物联网流量样本的包长度序列特征和消息长度序列特征进行分类的具体操作方法是:4
‑
1)以步骤3
‑
2)得到的物联网流量样本的包长度序列特征和消息长度序列特征作为输入,利用全连接层分别对物联网流量样本的包长度序列特征和消息长度序列特征进行分类,得到物联网流量样本的包长度序列特征和消息长度序列特征属于各个类别的概率特征;4
‑
2)以步骤4
‑
1)得到的物联网流量样本的包长度序列特征和消息长度序列特征属于各个类别的概率特征作为输入,进行概率特征融合操作,得到物联网流量样本属于各个类别的概率特征;4
‑
3)以步骤4
‑
2)得到...
【专利技术属性】
技术研发人员:缪亚男,徐小琳,赵悦楷,
申请(专利权)人:国家计算机网络与信息安全管理中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。