【技术实现步骤摘要】
加密流量应用识别方法和系统
[0001]本专利技术网络安全
,具体涉及一种加密流量应用识别方法和系统。
技术介绍
[0002]随着网路技术的快速发展,互联网已经在军事,经济、教育、生活等各个领域都有着广泛应用,然而,在互联网给我们的生活带来各种便利的同时,也带来了各种安全问题,如数据窃取、恶意软件横行等,为互联网用户的安全带来了巨大挑战。为了保护传输数据,加密传输已成为现有广泛应用的方式。采用加密传输有益于保护普通用户的隐私,然而这也给了恶意应用开发者可乘之机,开始大量使用加密流量来逃避检测,为此提出基于多模态加密流量的应用识别的方案,用于识别加密流量的应用行为,通过识别加密流量的应用,识别其具体的行为如邮件、音频、视频、电商等,发现其行为恶意数据传输还是具体某种价值的应用,就显得尤为重要。
[0003]传统的方法是利用手工编写规则进行加密流量应用识别,或者通过服务端域名信息识别,还有通过机器学习进行识别,但是手工编写规则的方式适用于结构较为规整、规律性强的加密流量,针对一种应用编写的规则通常难以应用到其他情况 ...
【技术保护点】
【技术特征摘要】
1.一种加密流量应用识别方法,其特征在于,所述方法包括:获取待识别加密流量,提取所述待识别加密流量的包特征数据和载荷数据,并将所述载荷数据转换为图片;将所述包特征数据和所述图片输入预先训练的应用识别模型中,以得到所述待识别加密流量对应的应用类型;其中,所述应用识别模型是利用包特征数据样本和图片样本进行训练得到的,所述包特征数据样本和所述图片样本是通过加密流量样本进行特征转换得到的。2.根据权利要求1所述的加密流量应用识别方法,其特征在于,利用包特征数据样本和图片样本进行训练得到所述应用识别模型,具体包括:获取加密流量样本,并对所述加密流量样本的数据包进行标记;基于标记后的所述加密流量样本的数据包得到包特征数据样本和图片样本;将所述包特征数据样本和所述图片样本进行模态对齐,以得到特征向量;将所述特征向量输入到预先构建的深度学习模型中进行训练,以得到应用识别模型。3.根据权利要求2所述的加密流量应用识别方法,其特征在于,基于标记后的所述加密流量样本的数据包得到包特征数据样本和图片样本,具体包括:对标记后的所述加密流量样本的数据包进行解析,以得到五元组信息样本和载荷信息样本;对所述五元组信息样本进行特征处理,以得到包特征数据样本,将所述载荷信息样本转换为图片样本。4.根据权利要求3所述的加密流量应用识别方法,其特征在于,对所述五元组信息样本进行特征处理,以得到包特征数据样本,具体包括:对解析后的所述五元组信息样本进行特征工程;确定所述五元组信息样本中的异常数据,并对异常数据进行清洗;根据通信时长及会话的五元组信息进程对清洗后得到的目标数据进行特征衍生,以得到包特征数据样本。5.根据权利要求4所述的加密流量应用识别方法,其特征在于,对解析后的所述五元组信息样本进行特征工程,具体包括:确定数据缺失值,把缺失值大于总数60%的数据进行...
【专利技术属性】
技术研发人员:任玉坤,孙亭,
申请(专利权)人:北京观成科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。