一种面向移动终端加密流量的应用识别方法技术

技术编号：36807208 阅读：12 留言：0更新日期：2023-03-09 00:22

本发明专利技术涉及的是一种网络流量识别场景，针对目前应用最广泛的移动终端应用和加密网络流量而提出了基于深度学习和注意力机制的面向移动终端加密流量的应用识别方法。现阶段基于深度学习模型，都是使用不同数量CNN和LSTM通过并行或者串行的方式进行流量识别，识别对象为针对加密流量的国外应用数据集，不适用于国内应用环境并且识别效果有待提高。而本发明专利技术使用的数据集是针对国内常用应用采集并准确标记的，并且在CNN和LSTM的基础上使用注意力机制进行应用识别，能够有效的进行国内应用的识别，并且识别效果优于单纯的深度学习模型。并且识别效果优于单纯的深度学习模型。并且识别效果优于单纯的深度学习模型。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向移动终端加密流量的应用识别方法

[0001]本专利技术属于网络流量识别
，具体涉及一种面向移动终端加密流量的应用识别方法。

技术介绍

[0002]网络流量分类是网络监控系统的重要组成部分，它的功能是对网络流量的上层服务、应用程序和用户动作等进行识别。网络流量分类的结果对于网络监控、网络安全服务以及个人信息保护有重大的意义。为了进行有效的流量识别，出现了基于端口、负载、机器学习和深度学习的不同分类技术，他们都是基于流量的特征进行流量识别和分类。然而，这些技术目前并不都是适用的，端口转发等技术的应用使得基于端口的识别不再有效；数据加密技术使得基于负载的识别技术不再适用；流量特征的多变性也使得基于机器学习的识别需要付出巨大的人力成本；深度学习技术使用更广泛，但是识别效果有待提高。

技术实现思路

[0003]本专利技术的目的在于提供一种面向移动终端加密流量的应用识别方法。
[0004]一种面向移动终端加密流量的应用识别方法，包括以下步骤：
[0005]1)在安卓平台使用PCAPdroid工具，分别采集待识别应用产生的网络流量pcap文件，在采集过程中每次只捕获一种应用的流量，确保流量与应用能够一一对应；
[0006]2)对采集的网络流量pcap文件进行清洗，去除后台流量、非加密流量、异常流量和零负载流量；
[0007]3)根据PCAPdroid生成的应用信息csv文件进行数据标记，将不同应用的流量分不同目录存放；
[0008]4)选取数据包的源端口、目标端...

【技术保护点】

【技术特征摘要】
1.一种面向移动终端加密流量的应用识别方法，其特征在于，包括以下步骤：1)在安卓平台使用PCAPdroid工具，分别采集待识别应用产生的网络流量pcap文件，在采集过程中每次只捕获一种应用的流量，确保流量与应用能够一一对应；2)对采集的网络流量pcap文件进行清洗，去除后台流量、非加密流量、异常流量和零负载流量；3)根据PCAPdroid生成的应用信息csv文件进行数据标记，将不同应用的流量分不同目录存放；4)选取数据包的源端口、目标端口、数据包负载长度、TCP窗口大小、数据包方向和数据包之间的时间间隔6个特征作为分类的数据特征，生成csv文件；5)从清洗后得到的网络流量中提取特征信息，并对不同长度的流量进行截取和填充，经过处理后获取的数据包特征数据是二维矩阵的形式，该矩阵中包含数据包信息和不同数据包之间的时间序列信息；6)训练基于注意力机制的应用识别模型；所述基于注意力机制的应用识别模型包括两层CNN、一层LSTM层、注...

【专利技术属性】
技术研发人员：玄世昌，杨武，王巍，苘大鹏，吕继光，向浩伟，
申请(专利权)人：哈尔滨工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人