【技术实现步骤摘要】
基于异步相关性的关联方法与设备
本申请涉及信息
,尤其涉及一种基于异步相关性的关联技术。
技术介绍
在现有的技术方案中,针对通过业务系统进行数据库操作的审计技术比较复杂,主要是因为用户操作与数据库操作之间的映射关系的数据量比较大,对技术的要求比较高。目前的技术方案主要分为两类:同步相关性的关联审计和异步相关性的关联审计。其中,同步相关性是指业务的执行跟数据库的操作在时间上呈包含关系,一般是数据库的执行时间包含在业务操作的时间范围之内,依据业务操作的起始时间和结束时间,在对应数据库操作中找出在此时间范围内的SQL数据(如图1所示),形成相应的映射规则。异步相关性是指业务的执行跟数据库的操作在时间上可能存在交叉或者完全不包含的关系,有可能业务的执行已经返回,而数据库的操作在一段时间后才执行完成(如图2所示),例如电商平台的订单系统和库存系统属于异步相关性。目前大量的研究都是采用基于同步相关性实现没有时间偏差的业务与SQL关联,而基于异步相关性的研究非常少。如果在异步相关性的业务场景下依然使用同步相关性的方法进行关联就会出错,主要体现在以下方面:(1)针对业务的操作时间跟SQL的执行时间不完全在一个时间段范围内,有可能业务操作已经结束,而SQL操作还没有开始,使用传统的方法无法进行业务与SQL的准确关联。(2)目前的业务与SQL关联的时间模型中缺少关于关联规则稳定性的描述,相对来说得出的关联规则的结果的可靠性的判断不全面。
技术实现思路
本申请的一个目的是提供一种基于异步相关性的关联方法与 ...
【技术保护点】
1.一种基于异步相关性的关联方法,其中,所述方法包括:/n创建关于业务操作与数据库操作的关联规则模型,在规则模型中为每个业务系统分别创建关联映射规则表,其中,所述关联规则模型包括所述规则模型和时间模型,所述关联映射规则表用于存储每个业务操作与对应的数据库操作的映射关系以及所述规则模型和所述时间模型的得分信息;/n在所述业务系统的运行过程中,接收并存储所述业务系统的业务操作数据与数据库操作数据,形成所述业务操作数据与所述数据库操作数据对应的业务关联组;/n根据所述业务操作数据与所述数据库操作数据对应的业务关联组,基于机器学习确定所述规则模型和所述时间模型的得分信息,更新所述业务系统对应的关联映射规则表。/n
【技术特征摘要】
1.一种基于异步相关性的关联方法,其中,所述方法包括:
创建关于业务操作与数据库操作的关联规则模型,在规则模型中为每个业务系统分别创建关联映射规则表,其中,所述关联规则模型包括所述规则模型和时间模型,所述关联映射规则表用于存储每个业务操作与对应的数据库操作的映射关系以及所述规则模型和所述时间模型的得分信息;
在所述业务系统的运行过程中,接收并存储所述业务系统的业务操作数据与数据库操作数据,形成所述业务操作数据与所述数据库操作数据对应的业务关联组;
根据所述业务操作数据与所述数据库操作数据对应的业务关联组,基于机器学习确定所述规则模型和所述时间模型的得分信息,更新所述业务系统对应的关联映射规则表。
2.根据权利要求1所述的方法,其中,接收并存储所述业务系统的业务操作数据与数据库操作数据,包括:
接收所述业务系统的业务操作数据,并将所述业务操作数据存储到RAW_BIZ中;
接收所述业务系统的数据库操作数据,并将所述数据库操作数据存储到RAW_DATA中。
3.根据权利要求2所述的方法,其中,形成所述业务操作数据与所述数据库操作数据对应的业务关联组,包括:
根据所述RAW_BIZ中的每个业务操作的起始时间BIZ_START,以及最大时间偏差范围MAX_TIME_DIFF,从所述RAW_DATA中获取执行时间在BIZ_START与BIZ_START+MAX_TIME_DIFF之间的数据库操作数据,形成所述业务操作数据与所述数据库操作数据对应的业务关联组。
4.根据权利要求1至3中任一项所述的方法,其中,形成所述业务操作数据与所述数据库操作数据对应的业务关联组,还包括:
按照所述业务操作出现的次数计数BIZ_COUNT_X,所述业务操作每出现一次BIZ_COUNT_X均增加一次,按照同一次所述业务操作内关联的所述数据库操作出现的次数计数SQL_COUNT_X,相同的所述数据库操作每出现一次SQL_COUNT_X增加一次;
将所述业务操作执行的开始时间与所述数据库操作执行的开始时间之间的时间差指记为BIZ_SQL_TIME_DIFF_X,每当出现所述业务操作计算所述BIZ_SQL_TIME_DIFF_X。
5.根据权利要求4所述的方法,其中,基于机器学习确定所述规则模型的得分信息,包括:
通过对所述BIZ_COUNT_X进行处理,得到低阀值命中数LOWER_MATCH_NUM、高阀值命中数UPPER_MATCH_NUM以及高阀值命中比例UPPER_SCORE;
根据所述低阀值命中数LOWER_MATCH_NUM、所述高阀值命中数UPPER_MATCH_NUM以及所述高阀值命中比例UPPER_SCORE,计算得到基础可信度RELIABILITY;
若所有的命中数均不高于所述高阀值命中数UPPER_MATCH_NUM,则最终的可信度即等于所述基础可信度RELIABILITY;否则,最终的可信度等于(RELIABILITY+(UPPER_SCORE*U...
【专利技术属性】
技术研发人员:王洪涛,
申请(专利权)人:上海上讯信息技术股份有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。