【技术实现步骤摘要】
流量数据库构建方法和流量检测模型训练方法
[0001]本申请涉及网络安全
,具体而言,涉及一种流量数据库构建方法和流量检测模型训练方法。
技术介绍
[0002]网络安全问题是网络环境中需要重点关注的问题,虽然已经采取了各种网络安全防护措施,但是单一的安全防护措施,并不能满足目前对于网络评估的需求。为了提高安全防护的响应能力,一些安全厂商在大数据的基础上利用一些机器学习和人工智能(Artificial Intelligence,简称:AI)算法解决网络安全问题。但是目前的采用机器学习对网络安全的识别还是存在一些不足。
技术实现思路
[0003]本申请的目的在于提供一种流量数据库构建方法和流量检测模型训练方法,以改善目前的采用机器学习对网络安全的识别上的不足。
[0004]第一方面,本专利技术提供一种流量数据库构建方法,包括:
[0005]获取流量数据集,所述流量数据集中的每一组流量数据包括:多类型日志;
[0006]根据所述流量数据集中的流量数据的多类型日志,确定出聚合数据集;r/>[0007]对本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种流量数据库构建方法,其特征在于,包括:获取流量数据集,所述流量数据集中的每一组流量数据包括:多类型日志;根据所述流量数据集中的流量数据的多类型日志,确定出聚合数据集;对所述聚合数据集中的各聚合数据进行特征提取,以形成特征数据集;对所述特征数据集进行分类处理,以得到多类特征数据集;基于所述多类特征数据集,构建特征数据库,所述特征数据库中的特征数据用于训练流量检测模型。2.根据权利要求1所述的方法,其特征在于,所述根据所述流量数据集中的流量数据的多类型日志,确定出聚合数据集,包括:根据所述流量数据集中的流量数据的多类型日志,确定出所述流量数据集中各条流量数据的四元组数据;将所述流量数据集中四元组数据相同的流量数据进行聚合处理,得到聚合数据集。3.根据权利要求2所述的方法,其特征在于,所述多类型日志包括:连接通信日志、SSL协议日志和证书日志;所述根据所述流量数据集中的流量数据的多类型日志,确定出四元组数据集,包括:针对所述流量数据集中的目标流量数据,从所述目标流量数据中的目标连接通信日志获取目标连接标识,所述目标流量数据为所述流量数据集中任意一项流量数据;根据所述目标连接标识,连接所述目标流量数据的目标SSL协议日志;从所述目标SSL协议日志获取目标证书路径;根据所述目标证书路径,获得所述目标流量数据的目标证书日志;从所述目标连接通信日志、目标SSL协议日志和目标证书日志,确定出所述目标流量数据的目标四元组数据。4.根据权利要求1所述的方法,其特征在于,所述多类型日志包括:连接通信日志、SSL协议日志和证书日志;所述对所述聚合数据集中的各聚合数据进行特征提取,以形成特征数据集,包括:针对聚合数据集中的目标聚合数据,从所述目标聚合数据中的所有连接通信日志中,提取通信特征,所述目标聚合数据为所述聚合数据集中任意一组聚合数据;从所述目标聚合数据中的所有SSL协议日志中,提取协议特征;从所述目标聚合数据中的所有证书日志中,提取证书特征。5.根据权利要求1所述的方法,其特征在于,所述对所述特征数据集进行分类处理,以得到多类特征数据集,包括:根据所述特征数据集中各项特征数据,确定出各项特征数据所表征的特征数据所属通信来源;根据所述特征数据集中各项...
【专利技术属性】
技术研发人员:尹立,
申请(专利权)人:北京天融信科技有限公司北京天融信软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。