建立数据检测模型的方法、数据检测方法及设备技术

技术编号：17253995 阅读：32 留言：0更新日期：2018-02-11 14:46

本发明专利技术提供一种建立数据检测模型的方法、数据检测方法及设备，其中建立数据检测模型的方法包括：获取入侵流量样本、流量行为规则以及入侵流量样本的标记信息，标记信息用于表示入侵流量样本的性质；利用入侵流量样本、流量行为规则以及入侵流量样本的标记信息对机器学习模型进行训练，直至机器学习模型对入侵流量样本识别准确率达到预设条件，其中机器学习模型包括存储模块、关联模块和检测模块，入侵流量样本分别作为关联模块和检测模块的输入数据，存储模块用于存储行为规则信息，关联模块对入侵流量样本与行为规则信息进行匹配度计算以输出相关程度信息，检测模块根据入侵流量样本和相关程度信息输出入侵流量样本的性质信息。

全部详细技术资料下载

【技术实现步骤摘要】
建立数据检测模型的方法、数据检测方法及设备
本专利技术涉及数据安全领域，具体涉及一种建立数据检测模型的方法、数据检测方法及设备。
技术介绍
互联网中普遍存在恶意数据，这些恶意数据通常用于入侵用户的电子设备，现有的入侵检测系统主要有两类：一是基于特征的检测，利用恶意数据攻击特征库来检测网络中的入侵，二是基于异常的检测，根据历史网络行为规律来找出当前不合规律即异常行为。基于特征的检测中，每个攻击特征都用规则或规则链表示，它的基本工作流程是先从网络中抓取流量数据包，然后分析流量包中的内容，和规则集相对照，当数据包内容完全满足规则定义时则触发规则对应的动作，例如记录、警报等。这种方法需要事先建立攻击特征库，由规则来表示攻击特征，因此这种方法适用于已知其攻击特征的攻击类型，不能检测到未知攻击。基于异常的检测通常是使用统计或机器学习的方法，对已经标记好的历史数据进行学习建模，然后对抓取网络流量包获取该时刻流量或该时间段流量的特征，依据模型判断流量是否为异常或攻击。这种方法根据历史网络行为进行建模来区分正常和异常行为，但网络行为比较复杂，因此这种方法误报率比较高，经常会把正常流量判定为攻击，发出警报后仍需要人工做大量的验证工作。由此可见，现有的数据检测方式准确性较低。
技术实现思路
本专利技术要解决的是现有的数据检测方式准确性低的问题。有鉴于此，第一方面，本专利技术提供一种建立数据检测模型的方法，包括：获取入侵流量样本、流量行为规则以及所述入侵流量样本的标记信息，所述标记信息用于表示所述入侵流量样本的性质；利用入侵流量样本、流量行为规则以及所述入侵流量样本的标记信息对机器学...
建立数据检测模型的方法、数据检测方法及设备

【技术保护点】
一种建立数据检测模型的方法，其特征在于，包括：获取入侵流量样本、流量行为规则以及所述入侵流量样本的标记信息，所述标记信息用于表示所述入侵流量样本的性质；利用入侵流量样本、流量行为规则以及所述入侵流量样本的标记信息对机器学习模型进行训练，直至所述机器学习模型对入侵流量样本识别准确率达到预设条件，其中所述机器学习模型包括存储模块、关联模块和检测模块，所述入侵流量样本分别作为关联模块和检测模块的输入数据，存储模块用于存储所述行为规则信息，关联模块对入侵流量样本与行为规则信息进行匹配度计算以输出相关程度信息，检测模块根据入侵流量样本和相关程度信息输出入侵流量样本的性质信息。

【技术特征摘要】
1.一种建立数据检测模型的方法，其特征在于，包括：获取入侵流量样本、流量行为规则以及所述入侵流量样本的标记信息，所述标记信息用于表示所述入侵流量样本的性质；利用入侵流量样本、流量行为规则以及所述入侵流量样本的标记信息对机器学习模型进行训练，直至所述机器学习模型对入侵流量样本识别准确率达到预设条件，其中所述机器学习模型包括存储模块、关联模块和检测模块，所述入侵流量样本分别作为关联模块和检测模块的输入数据，存储模块用于存储所述行为规则信息，关联模块对入侵流量样本与行为规则信息进行匹配度计算以输出相关程度信息，检测模块根据入侵流量样本和相关程度信息输出入侵流量样本的性质信息。2.根据权利要求1所述的方法，其特征在于，所述入侵流量样本采用特征化向量进行表示。3.根据权利要求1所述的方法，其特征在于，所述流量行为规则为根据数据行为规则链建立的矩阵。4.根据权利要求1所述的方法，其特征在于，所述关联模块的数量为多个，多个关联模块分别利用所述特征化向量和相应的行为规则信息进行训练，使多个关联模块分别输出所述入侵流量样本与行为规则信息的关联程度信息。5.一种数据检测方法，其特征在于，包括：获取网络流量信息；根据所述网络流量信息确定所述网络流量信息与预设行为规则的关联程度信息；根据所述网络流量信息和所述关联程度信息确定所述网络流量信息的性质。6.根据权利要求5所述的方法，其特征在于，所述根据所述网络流量信息确定所述网络流...

【专利技术属性】
技术研发人员：龙春，高筱娴，赵静，杨帆，
申请(专利权)人：中国科学院计算机网络信息中心，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人