【技术实现步骤摘要】
一种基于大数据的数据库用户行为的分析方法及系统
[0001]本专利技术涉及大数据挖掘
,特别是涉及一种基于大数据的数据库用 户行为的分析方法及系统。
技术介绍
[0002]随着信息技术日益发展,数据库得到了快速的发展和广泛的应用,信息量 大,具有海量数据。数据库已经成为信息系统不可或缺的核心资产,其所承载 的信息决定了保证数据库安全的必要性。近些年,数据安全事件层出不穷,数 据库安全问题在所有安全问题中居于第一位,而防火墙/IDS等对数据库安全 的保护效率不高,更多的安全威胁促使需要对数据库本身进行更高的安全防 护。数据库安全威胁的一大半来自内部用户的误操作和恶意操作,因为内部人 员对自己的数据库管理系统更加熟悉,而且有一定的授权,掌握一定的密码。 因此,数据库用户行为直接影响了数据库的安全性。对此,本专利技术提出一种基 于大数据的数据库用户行为的分析方法及系统。
技术实现思路
[0003]本专利技术的目的是提供一种基于大数据的数据库用户行为的分析方法及系 统,利用大数据挖掘技术,对数据库用户行为进行关 ...
【技术保护点】
【技术特征摘要】
1.一种基于大数据的数据库用户行为的分析方法,其特征在于,包括:从用户数据库日常操作中获取用户的操作行为并对所述操作行为和用户名进行编码预处理,得编码事务组,所述编码事务组包括多个编码事务,每一所述编码事务包括一个用户名编码和完成一个独立会话所执行的多条操作行为编码;对每一所述编码事务,根据所述用户名编码和多个所述操作行为编码构建多个项集;所述项集至少包括一个元素,所述元素为所述用户名编码或所述操作行为编码;利用FP
‑
growth算法确定所有所述项集中的频繁项集,所述频繁项集的支持度大于最小支持度阈值;对每一所述频繁项集,根据所述频繁项集包括的所有所述元素构建所述频繁项集的多个非空子集;将所述非空子集和所述非空子集对应的非空补集作为一个子集组合,得到多个子集组合;对每一所述子集组合,计算所述子集组合中的所述非空子集和对应的所述非空补集之间蕴含关系的置信度和提升度,根据所述置信度和所述提升度构建用户典型正常行为规则库和用户非典型正常行为规则库;根据所述用户典型正常行为规则库和所述用户非典型正常行为规则库对数据库用户行为进行分析。2.根据权利要求1所述的方法,其特征在于,所述从用户数据库中获取用户的操作行为并对所述操作行为和用户名进行编码预处理,得编码事务组,具体包括:收集所述用户操作所述用户数据库的所有SQL操作语句;将每一所述用户完成一个独立会话所执行的所有所述SQL操作语句作为一个事务,得到所有所述用户对应的事务组;所述SQL操作语句包括操作信息、操作类型、数据库表和约束条件;对各用户名、各所述操作信息、各所述操作类型、各所述数据库表和各所述约束条件进行编码;根据编码信息对所述事务组中每一所述事务包括的所述用户和对应的所有所述SQL操作语句进行编码,得到多个编码事务;所述编码事务包括所述用户名编码和对应的完成一个独立会话所执行的SQL操作语句编码。3.根据权利要求1所述的方法,其特征在于,所述对每一所述编码事务,根据所述用户名编码和多个所述操作行为编码构建多个项集,具体包括:从所述用户名编码和多个所述操作行为编码任选一个,构建一项集;从所述用户名编码和多个所述操作行为编码任选i个,构建i项集;i等于二、三,...,M;M为预设元素数;所述预设元素数的最大值为所述用户名编码和所述操作行为编码的总个数;所述项集包括一项集,二项集,...,M项集。4.根据权利要求3所述的方法,其特征在于,所述利用FP
‑
growth算法确定所有所述项集中的频繁项集,具体包括:从所述事务组中提取所有的所述一项集,并对每一所述一项集计算支持度,删除所述支持度小于所述最小支持度阈值的所述一项集,得到频繁一项集;将所有所述频繁一项集放入项头表中,并将所述频繁一项集按照支持度大小进行降序排列;
将所述事务组中的非频繁一项集删除,并将剩余的所有所述项集按照支持度大小进行降序排列;将降序排列后的所有剩余的所述项集插入FP树;在FP树中找所述项头表中各项对应的条件模式基,根据条件模式基得到频繁二项集;根据频繁i项集得到频繁i+1项集;i等于二、三,...,M;判断i+1是否为M或频繁i+1项集是否为空集;若i+1不为M,或频繁i+1项集不为空集,则令i+1=i,返回步骤“根据频繁i项集得到频繁i+1项集”,直至i+1为M或频繁i+1项集是否为空集;若i+1为M或频繁i+1项集为空集,则得到所有频繁项集及对应的所述支持度,所述频繁项集包括所述频繁一项集,所述频繁二项集,...,频繁M项集。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取当前所述用户数据库的新操作行为,并对所述新操作行为和对应的所述用户名进行编码预处理,得新编码事务组;对每一所述新编码事务,根据所述用户名编码和多个所述新操作行为编码构建多个新项集;利用FP
‑
growth算法确定所有所述新项...
【专利技术属性】
技术研发人员:周喜东,郑敏波,张文敏,马天宁,赵少川,方莉莉,
申请(专利权)人:北京安信天行科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。