一种基于运行日志数据构建服务模式的方法技术

技术编号:35303602 阅读:10 留言:0更新日期:2022-10-22 12:53
本发明专利技术提供了一种基于运行日志数据构建服务模式的方法,包括:S1、获取历史服务方案数据以及运行日志数据,每个服务方案由多个服务以及服务间的业务处理逻辑构成,每条运行日志包含对服务方案中至少一个服务是否成功运行的记录;S2、基于所述历史服务方案数据以及所述运行日志数据构建每个服务方案对应的服务方案图,所有服务方案的服务方案图构成服务方案图集,每个服务方案图是包括多个节点和边的有向图,节点表示服务,边表示服务间的业务处理逻辑,每条边设有基于运行日志数据获得的指示该边所连接两个节点之间关联强度的权值;S3、根据各节点和边在服务方案图集中出现频率以及边的权值挖掘频繁子图,以及基于挖掘出的频繁子图构造服务模式。频繁子图构造服务模式。频繁子图构造服务模式。

【技术实现步骤摘要】
一种基于运行日志数据构建服务模式的方法


[0001]本专利技术涉及数据挖掘领域,具体来说涉及频繁子图挖掘
,更具体地说,涉及一种基于运行日志数据构建服务模式的方法。

技术介绍

[0002]随着计算机技术的高速发展和实际应用深入化,处于大数据时代下服务互联网的相关研究逐渐成熟,传统服务与信息技术正逐步结合,向服务化进行转型,越来越多的线下服务资源被服务中介商整合后发布到互联网上,从而导致互联网上的服务资源规模和类型越来越复杂。
[0003]与此同时,用户的种类和数量也随之增长,并且用户的需求也变得庞杂,仅依靠现有的细粒度原子服务(对应于单个服务)已经无法有效地满足用户的个性化需求。因此,基于某一业务需求将多个原子服务进行合理组合形成大粒度服务方案成为一种可行的办法。在此过程中,如何基于海量的原子服务快速构建服务方案是需要解决的首要问题。
[0004]研究发现,很多服务之间存在一定的业务逻辑交互关系,这些服务通常在服务方案中以固定的流程片段形式出现。如果在构建服务方案时,以这些大粒度的流程片段为基础,将不同的流程片段及原子服务组合起来,可以简化服务方案的构建步骤,有效地提升构建效率。因此,提出服务模式的概念,通过服务模式描述、刻画大粒度流程片段,进而支撑服务方案的构建。
[0005]但目前挖掘服务模式主要是直接根据历史服务方案数据计算相应的流程片段的支持度是否满足最小支持度,若是,则认为该流程片段是一个频繁的服务模式,则可以挖掘出该服务模式作为以后构建服务方案的参考。但是,这种仅依靠历史服务方案数据挖掘出的服务模式因为缺乏其他信息的支持,其准确性有待提高。

技术实现思路

[0006]因此,本专利技术的目的在于克服上述现有技术的缺陷,提供一种基于运行日志数据构建服务模式的方法。
[0007]本专利技术的目的是通过以下技术方案实现的:
[0008]根据本专利技术的第一方面,提供一种基于运行日志数据构建服务模式的方法,包括:S1、获取历史服务方案数据以及运行日志数据,历史服务方案数据包括多个服务方案,每个服务方案由多个服务以及服务间的业务处理逻辑构成,运行日志数据包括多条运行日志,每条运行日志包含对服务方案中至少一个服务是否成功运行的记录;S2、基于所述历史服务方案数据以及所述运行日志数据构建每个服务方案对应的服务方案图,所有服务方案的服务方案图构成服务方案图集,其中,每个服务方案图是包括多个节点和边的有向图,节点表示服务,边表示服务间的业务处理逻辑,每条边设有基于运行日志数据获得的指示该边所连接的两个节点之间关联强度的权值;S3、根据各节点和边在服务方案图集中出现频率以及边的权值挖掘频繁子图,以及基于挖掘出的频繁子图构造服务模式。
[0009]在本专利技术的一些实施例中,每条边的权值按照以下方式确定:根据运行日志数据中各运行日志的记录及生成时间的属性,生成一个或者多个日志窗口及其窗口时间;根据每个日志窗口中所含的运行日志确定边在每个日志窗口中成功执行的执行次数;以及根据边在每个日志窗口中成功执行的执行次数以及每个日志窗口的窗口时间,确定该边的权值。
[0010]在本专利技术的一些实施例中,按照以下方式生成日志窗口及其窗口时间:利用滑动窗口从运行日志数据中每读取预定条数的指示服务成功运行的运行日志生成一个日志窗口,并以该日志窗口所含的最后一条运行日志的生成时间作为日志窗口的窗口时间。
[0011]在本专利技术的一些实施例中,每条边的权值按照以下方式计算:将该边所对应的各日志窗口中成功执行的执行次数分别乘以一个衰减因子得到的乘积求和后除以日志窗口的总数量,其中,该衰减因子的大小与最后一个日志窗口的窗口时间和该日志窗口的窗口时间之间差值的绝对值的大小负相关。
[0012]在本专利技术的一些实施例中,每条边的权值按照以下方式计算:
[0013][0014]其中,C
t
<S
m
,S
n
>表示边E<S
m
,S
n
>的权值,r
i
表示该边在日志窗口i中成功执行的执行次数,X
i
表示衰减因子,X
i
=2

λt
,λ表示调整参数,λ>0,t=|t
k

t
i
|,k表示当前用于计算权值的日志窗口的总数量,t表示最后一个的日志窗口的窗口时间与日志窗口i的窗口时间之间差值的绝对值。
[0015]在本专利技术的一些实施例中,所述方法还包括:针对每条边维护一个单链表,该单链表中的每个链表节点用于存储一个日志窗口中该边成功执行的执行次数以及该日志窗口的窗口时间;当一个链表节点中存储的日志窗口中该边成功执行的执行次数乘以对应的衰减因子的乘积小于预定的衰减阈值时,删除该链表节点。
[0016]在本专利技术的一些实施例中,步骤S3包括按照以下方式挖掘频繁子图:根据最小支持度和边的DFS编码,采用gSpan挖掘方式挖掘服务方案图集中的频繁子图,其中,边的DFS编码中边的标号根据边出现的频率以及边的权值确定。
[0017]在本专利技术的一些实施例中,为出现频率相对越高的边赋予相对越小的标号,为出现频率相同但边的权值相对越大的边赋予相对越小的标号。
[0018]在本专利技术的一些实施例中,步骤S3包括:获取预定的最小支持度,根据所有的节点和边在服务方案图集出现的频率,将出现频率小于最小支持度的节点和边移除,得到剩余的节点和边;针对剩余的节点,根据节点的出现频率更新节点的标号,其中,为出现频率相对越高的节点赋予相对越小的标号;针对剩余的边,以边的出现频率作为边排序的第一依据、边的权值作为边排序的第二依据,更新边的标号,其中,为出现频率相对越高的边赋予相对越小的标号,为出现频率相同但边的权值相对越大的边赋予相对越小的标号;利用更新的节点的标号和边的标号设置剩余的边在gSpan挖掘方式中的DFS编码;根据最小支持度和剩余的边的DFS编码,采用gSpan挖掘方式挖掘频繁子图。
[0019]在本专利技术的一些实施例中,所述gSpan挖掘方式为改进的gSpan挖掘方式,其中,改进的gSpan挖掘方式中的DFS编码包括:构成边的一个节点的标识、构成边的另一个节点的
标识、构成边的一个节点的标号、边的标号、构成边的另一个节点的标号、边的方向。
[0020]根据本专利技术的第二方面,提供一种构建服务方案的方法,包括:获取按照第一方面所述的方法构建的所有服务模式;从所有服务模式中选择一个或者多个服务模式,基于所选择的服务模式构建服务方案。
[0021]根据本专利技术的第三方面,提供一种电子设备,包括:一个或多个处理器;以及存储器,其中存储器用于存储可执行指令;所述一个或多个处理器被配置为经由执行所述可执行指令以实现权利要求第一方面或者第二方面所述方法的步骤。
[0022]与现有技术相比,本专利技术的优点在于:
[002本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于运行日志数据构建服务模式的方法,其特征在于,包括:S1、获取历史服务方案数据以及运行日志数据,历史服务方案数据包括多个服务方案,每个服务方案由多个服务以及服务间的业务处理逻辑构成,运行日志数据包括多条运行日志,每条运行日志包含对服务方案中至少一个服务是否成功运行的记录;S2、基于所述历史服务方案数据以及所述运行日志数据构建每个服务方案对应的服务方案图,所有服务方案的服务方案图构成服务方案图集,其中,每个服务方案图是包括多个节点和边的有向图,节点表示服务,边表示服务间的业务处理逻辑,每条边设有基于运行日志数据获得的指示该边所连接的两个节点之间关联强度的权值;S3、根据各节点和边在服务方案图集中出现频率以及边的权值挖掘频繁子图,以及基于挖掘出的频繁子图构造服务模式。2.根据权利要求1所述的方法,其特征在于,每条边的权值按照以下方式确定:根据运行日志数据中各运行日志的记录及生成时间的属性,生成一个或者多个日志窗口及其窗口时间;根据每个日志窗口中所含的运行日志确定边在每个日志窗口中成功执行的执行次数;以及根据边在每个日志窗口中成功执行的执行次数以及每个日志窗口的窗口时间,确定该边的权值。3.根据权利要求1所述的方法,其特征在于,按照以下方式生成日志窗口及其窗口时间:利用滑动窗口从运行日志数据中每读取预定条数的指示服务成功运行的运行日志生成一个日志窗口,并以该日志窗口所含的最后一条运行日志的生成时间作为日志窗口的窗口时间。4.根据权利要求2或3所述的方法,其特征在于,每条边的权值按照以下方式计算:将该边所对应的各日志窗口中成功执行的执行次数分别乘以一个衰减因子得到的乘积求和后除以日志窗口的总数量,其中,该衰减因子的大小与最后一个日志窗口的窗口时间和该日志窗口的窗口时间之间差值的绝对值的大小负相关。5.根据权利要求4所述的方法,其特征在于,每条边的权值按照以下方式计算:其中,C
t
<S
m
,S
n
>表示边E<S
m
,S
n
>的权值,r
i
表示该边在日志窗口i中成功执行的执行次数,X
i
表示衰减因子,X
i
=2

λt
,λ表示调整参数,λ>0,t=|t
k

t
i
|,k表示当前用于计算权值的日志窗口的总数量,t表示最后一个日志窗口的窗口时间与日志窗口i的窗口时间之间差值...

【专利技术属性】
技术研发人员:杨冬菊王晓剑
申请(专利权)人:北方工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1