基于隐马尔科夫模型的用户行为与实体行为分析方法技术

技术编号：22974905 阅读：68 留言：0更新日期：2019-12-31 23:30

本发明专利技术公开了一种基于隐马尔科夫模型的用户行为与实体行为分析方法，包括：S1)搜集多方来源数据作为训练数据；S2)将异构数据使用One‑hot编码进行归一化；S3)对归一化后的结果进行递增编号；S4)设定时间窗口变量T，并根据时间窗口滚动划分出用户或实体的行为序列；S5)给定训练初始参数，得到用户或实体行为的转移概率矩阵与发射概率矩阵；S6)将HMM模型布置到实时生产环境上；S7)实时搜集多方数据来源，并获得对应的观测变量；S8)取时间窗口变量T长度的用户或实体行为序列，使用HMM模型预测得到发射概率。本发明专利技术能够解决传统单一维度的安全基线以及人为设定阈值存在偏差的情况。

Analysis method of user behavior and entity behavior based on Hidden Markov model

全部详细技术资料下载

【技术实现步骤摘要】
基于隐马尔科夫模型的用户行为与实体行为分析方法
本专利技术涉及一种用户行为与实体行为分析方法，尤其涉及一种基于隐马尔科夫模型的用户行为与实体行为分析方法。
技术介绍
随着办公连网设备与云服务的普及，每日所产生的安全日志爆炸式成长。为了从宏观的角度观测整体安全情况，常利用安全基线进行表示。传统技术使用累计值或同比、环比的方式来建立宏观角度的安全基线。若当下的安全情况低于安全基线的阈值时，则发出安全告警；但是使用此类安全基线维度无法显示多方数据的关联性，所以只能对单一维度的数据人为设定阈值，不仅在数据维度上表现较为单一，阈值定义也存在人为偏差。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于隐马尔科夫模型的用户行为与实体行为分析方法，能够解决传统单一维度的安全基线以及人为设定阈值存在偏差的情况。本专利技术为解决上述技术问题而采用的技术方案是提供一种基于隐马尔科夫模型的用户行为与实体行为分析方法，包括如下步骤：S1)搜集多方来源数据作为训练数据；S2)将异构数据使用One-hot编码进行归一化；S3)针对每个用户群体或实体类型归一化后的结果进行递增编号，代表HMM的观测变量；S4)设定时间窗口变量T，并根据时间窗口滚动划分出用户或实体的行为序列；S5)给定训练初始参数，包含初始转移概率矩阵A,初始发射概率矩阵B,隐藏变量数量S与初始状态概率矩阵π，进行HMM建模，得到用户或实体行为的转移概率矩阵与发射概率矩阵；S6)将HMM模型布置到实时生产环境上；S7)实时搜集多方数据来源，对每条数...

【技术保护点】
1.一种基于隐马尔科夫模型的用户行为与实体行为分析方法，其特征在于，包括如下步骤：/nS1)搜集多方来源数据作为训练数据；/nS2)将异构数据使用One-hot编码进行归一化；/nS3)针对每个用户群体或实体类型归一化后的结果进行递增编号，代表HMM的观测变量；/nS4)设定时间窗口变量T，并根据时间窗口滚动划分出用户或实体的行为序列；/nS5)给定训练初始参数，包含初始转移概率矩阵A,初始发射概率矩阵B,隐藏变量数量S与初始状态概率矩阵π，进行HMM建模，得到用户或实体行为的转移概率矩阵与发射概率矩阵；/nS6)将HMM模型布置到实时生产环境上；/nS7)实时搜集多方数据来源，对每条数据根据先前所得One-hot编码表，获得对应的观测变量；/nS8)取时间窗口变量T长度的用户或实体行为序列，使用HMM模型预测隐藏状态与对应发射概率矩阵得到发射概率，若发射概率低于设定的阈值，则发出安全告警。/n

【技术特征摘要】
1.一种基于隐马尔科夫模型的用户行为与实体行为分析方法，其特征在于，包括如下步骤：
S1)搜集多方来源数据作为训练数据；
S2)将异构数据使用One-hot编码进行归一化；
S3)针对每个用户群体或实体类型归一化后的结果进行递增编号，代表HMM的观测变量；
S4)设定时间窗口变量T，并根据时间窗口滚动划分出用户或实体的行为序列；
S5)给定训练初始参数，包含初始转移概率矩阵A,初始发射概率矩阵B,隐藏变量数量S与初始状态概率矩阵π，进行HMM建模，得到用户或实体行为的转移概率矩阵与发射概率矩阵；
S6)将HMM模型布置到实时生产环境上；
S7)实时搜集多方数据来源，对每条数据根据先前所得One-hot编码表，获得对应的观...

【专利技术属性】
技术研发人员：唐誌欣，黄宗纬，
申请(专利权)人：上海赛可出行科技服务有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人