基于异步相关性的关联方法与设备技术

技术编号:26689680 阅读:13 留言:0更新日期:2020-12-12 02:38
本申请的目的是提供一种基于异步相关性的关联方案。该方案先创建综合了规则模型和时间模型的关联规则模型,在所述规则模型中为每个业务系统分别创建关联映射规则表,所述关联映射规则表用于存储每个业务操作与对应的数据库操作的映射关系以及所述规则模型和所述时间模型的得分信息,然后在所述业务系统的运行过程中,接收并存储所述业务系统的业务操作数据与数据库操作数据,形成所述业务操作数据与所述数据库操作数据对应的业务关联组,再基于机器学习确定所述规则模型和所述时间模型的得分信息,更新所述业务系统对应的关联映射规则表。本申请通过添加所述时间模型,从而进一步有效提高业务操作与数据库操作之间的映射关联的准确性。

【技术实现步骤摘要】
基于异步相关性的关联方法与设备
本申请涉及信息
,尤其涉及一种基于异步相关性的关联技术。
技术介绍
在现有的技术方案中,针对通过业务系统进行数据库操作的审计技术比较复杂,主要是因为用户操作与数据库操作之间的映射关系的数据量比较大,对技术的要求比较高。目前的技术方案主要分为两类:同步相关性的关联审计和异步相关性的关联审计。其中,同步相关性是指业务的执行跟数据库的操作在时间上呈包含关系,一般是数据库的执行时间包含在业务操作的时间范围之内,依据业务操作的起始时间和结束时间,在对应数据库操作中找出在此时间范围内的SQL数据(如图1所示),形成相应的映射规则。异步相关性是指业务的执行跟数据库的操作在时间上可能存在交叉或者完全不包含的关系,有可能业务的执行已经返回,而数据库的操作在一段时间后才执行完成(如图2所示),例如电商平台的订单系统和库存系统属于异步相关性。目前大量的研究都是采用基于同步相关性实现没有时间偏差的业务与SQL关联,而基于异步相关性的研究非常少。如果在异步相关性的业务场景下依然使用同步相关性的方法进行关联就会出错,主要体现在以下方面:(1)针对业务的操作时间跟SQL的执行时间不完全在一个时间段范围内,有可能业务操作已经结束,而SQL操作还没有开始,使用传统的方法无法进行业务与SQL的准确关联。(2)目前的业务与SQL关联的时间模型中缺少关于关联规则稳定性的描述,相对来说得出的关联规则的结果的可靠性的判断不全面。
技术实现思路
本申请的一个目的是提供一种基于异步相关性的关联方法与设备。根据本申请的一个方面,提供了一种基于异步相关性的关联方法,其中,所述方法包括:创建关于业务操作与数据库操作的关联规则模型,在规则模型中为每个业务系统分别创建关联映射规则表,其中,所述关联规则模型包括所述规则模型和时间模型,所述关联映射规则表用于存储每个业务操作与对应的数据库操作的映射关系以及所述规则模型和所述时间模型的得分信息;在所述业务系统的运行过程中,接收并存储所述业务系统的业务操作数据与数据库操作数据,形成所述业务操作数据与所述数据库操作数据对应的业务关联组;根据所述业务操作数据与所述数据库操作数据对应的业务关联组,基于机器学习确定所述规则模型和所述时间模型的得分信息,更新所述业务系统对应的关联映射规则表。根据本申请的另一个方面,还提供了一种基于异步相关性的关联设备,其中,所述设备包括:模型创建模块,用于创建关于业务操作与数据库操作的关联规则模型,在规则模型中为每个业务系统分别创建关联映射规则表,其中,所述关联规则模型包括所述规则模型和时间模型,所述关联映射规则表用于存储每个业务操作与对应的数据库操作的映射关系以及所述规则模型和所述时间模型的得分信息;数据预处理模块,用于在所述业务系统的运行过程中,接收并存储所述业务系统的业务操作数据与数据库操作数据,形成所述业务操作数据与所述数据库操作数据对应的业务关联组;机器学习模块,用于根据所述业务操作数据与所述数据库操作数据对应的业务关联组,基于机器学习确定所述规则模型和所述时间模型的得分信息,更新所述业务系统对应的关联映射规则表。根据本申请的又一个方面,还提供了一种计算设备,其中,该设备包括用于存储计算机程序指令的存储器和用于执行计算机程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发所述设备执行所述的基于异步相关性的关联方法。根据本申请的又一个方面,还提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机可读指令可被处理器执行以实现所述的基于异步相关性的关联方法。本申请提供的方案中,先创建综合了规则模型和时间模型的关联规则模型,在所述规则模型中为每个业务系统分别创建关联映射规则表,所述关联映射规则表用于存储每个业务操作与对应的数据库操作的映射关系以及所述规则模型和所述时间模型的得分信息,然后在所述业务系统的运行过程中,接收并存储所述业务系统的业务操作数据与数据库操作数据,形成所述业务操作数据与所述数据库操作数据对应的业务关联组,再基于机器学习确定所述规则模型和所述时间模型的得分信息,更新所述业务系统对应的关联映射规则表。与现有技术相比,本申请在异步相关性的基础上,添加关于关联规则稳定性的时间模型,从而进一步有效提高业务操作与数据库操作之间的映射关联的准确性。本申请适用于大多数多层业务系统的审计工作,能有效稳定地识别并审计时间有偏差的业务与SQL关联的场景。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其他特征、目的和优点将会变得更明显:图1是一种同步相关性模型图;图2是一种异步相关性模型图;图3是根据本申请实施例的一种基于异步相关性的关联方法流程图;图4是一种SQL操作时间相对业务执行时间的动态偏移图;图5是根据本申请实施例的一种基于异步相关性的关联设备示意图。附图中相同或相似的附图标记代表相同或相似的部件。具体实施方式下面结合附图对本申请作进一步详细描述。在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的装置或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。本申请实施例提供了基于异步相关性的关联方法,可以实现时间有偏差的业务与SQL(一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统)关联,在异步相关性(如图2所示)的基础上,添加关于关联规则稳定性的时间模型,从而进一步有效提高业务操作与数据库操作之间的映射关联的准确性。该方法适用于大多数多层业务系统的审计工作,能有效稳定地识别并审计时间有偏差的业务与SQL关联的场景。在实际场景中,执行该方法的设备可以是用户设备、网络设备或者用户设备与网络设备通过网络相集成所构成的设备。其中,所述用户设备包括但不限于智能手机、平板电脑、个人计算机(PC)等终端设备,所述网络设备包括但不限于网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现。在此,云由基于云计算(CloudComputin本文档来自技高网...

【技术保护点】
1.一种基于异步相关性的关联方法,其中,所述方法包括:/n创建关于业务操作与数据库操作的关联规则模型,在规则模型中为每个业务系统分别创建关联映射规则表,其中,所述关联规则模型包括所述规则模型和时间模型,所述关联映射规则表用于存储每个业务操作与对应的数据库操作的映射关系以及所述规则模型和所述时间模型的得分信息;/n在所述业务系统的运行过程中,接收并存储所述业务系统的业务操作数据与数据库操作数据,形成所述业务操作数据与所述数据库操作数据对应的业务关联组;/n根据所述业务操作数据与所述数据库操作数据对应的业务关联组,基于机器学习确定所述规则模型和所述时间模型的得分信息,更新所述业务系统对应的关联映射规则表。/n

【技术特征摘要】
1.一种基于异步相关性的关联方法,其中,所述方法包括:
创建关于业务操作与数据库操作的关联规则模型,在规则模型中为每个业务系统分别创建关联映射规则表,其中,所述关联规则模型包括所述规则模型和时间模型,所述关联映射规则表用于存储每个业务操作与对应的数据库操作的映射关系以及所述规则模型和所述时间模型的得分信息;
在所述业务系统的运行过程中,接收并存储所述业务系统的业务操作数据与数据库操作数据,形成所述业务操作数据与所述数据库操作数据对应的业务关联组;
根据所述业务操作数据与所述数据库操作数据对应的业务关联组,基于机器学习确定所述规则模型和所述时间模型的得分信息,更新所述业务系统对应的关联映射规则表。


2.根据权利要求1所述的方法,其中,接收并存储所述业务系统的业务操作数据与数据库操作数据,包括:
接收所述业务系统的业务操作数据,并将所述业务操作数据存储到RAW_BIZ中;
接收所述业务系统的数据库操作数据,并将所述数据库操作数据存储到RAW_DATA中。


3.根据权利要求2所述的方法,其中,形成所述业务操作数据与所述数据库操作数据对应的业务关联组,包括:
根据所述RAW_BIZ中的每个业务操作的起始时间BIZ_START,以及最大时间偏差范围MAX_TIME_DIFF,从所述RAW_DATA中获取执行时间在BIZ_START与BIZ_START+MAX_TIME_DIFF之间的数据库操作数据,形成所述业务操作数据与所述数据库操作数据对应的业务关联组。


4.根据权利要求1至3中任一项所述的方法,其中,形成所述业务操作数据与所述数据库操作数据对应的业务关联组,还包括:
按照所述业务操作出现的次数计数BIZ_COUNT_X,所述业务操作每出现一次BIZ_COUNT_X均增加一次,按照同一次所述业务操作内关联的所述数据库操作出现的次数计数SQL_COUNT_X,相同的所述数据库操作每出现一次SQL_COUNT_X增加一次;
将所述业务操作执行的开始时间与所述数据库操作执行的开始时间之间的时间差指记为BIZ_SQL_TIME_DIFF_X,每当出现所述业务操作计算所述BIZ_SQL_TIME_DIFF_X。


5.根据权利要求4所述的方法,其中,基于机器学习确定所述规则模型的得分信息,包括:
通过对所述BIZ_COUNT_X进行处理,得到低阀值命中数LOWER_MATCH_NUM、高阀值命中数UPPER_MATCH_NUM以及高阀值命中比例UPPER_SCORE;
根据所述低阀值命中数LOWER_MATCH_NUM、所述高阀值命中数UPPER_MATCH_NUM以及所述高阀值命中比例UPPER_SCORE,计算得到基础可信度RELIABILITY;
若所有的命中数均不高于所述高阀值命中数UPPER_MATCH_NUM,则最终的可信度即等于所述基础可信度RELIABILITY;否则,最终的可信度等于(RELIABILITY+(UPPER_SCORE*U...

【专利技术属性】
技术研发人员:王洪涛
申请(专利权)人:上海上讯信息技术股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1