一种面向复杂业务流程的可复用组件挖掘方法技术

技术编号:29672099 阅读:14 留言:0更新日期:2021-08-13 21:53
该发明专利技术公开了一种面向复杂业务流程的可复用组件挖掘方法,属于软件复用技术领域。该发明专利技术面向业务流程进行流程相似性分析,可以从业务流中挖掘相似子流程集合作为该软件的一个组件模块,在保证组件质量的前提下大大提高构建组件的速度;该发明专利技术方法只需要输入系统的业务流程图,便可自动挖掘出基于该系统的可复用组件,无需其他配置,优化工业管理软件开发周期,降低软件开发难度,为后续的软件维护成本降低提供有力支持;通过企业实际软件流程图数据进行具体实施,该发明专利技术方法自动挖掘可复用组件,从而能够更好地利用软件复用技术进行软件开发,为提高工业管理软件开发效率和降低工业管理软件开发成本提供支持。

【技术实现步骤摘要】
一种面向复杂业务流程的可复用组件挖掘方法
本专利技术属于软件复用
,特别是面向复杂业务流程的可复用组件挖掘方法,分类号为G06K。
技术介绍
作为智能制造的承载,工业管理软件已深度融入工业设计及制造流程,成为制造业的信息化核心。随着市场的增长,工业管理软件的体系结构越来越复杂,质量要求日渐提高,如何快速高效地进行工业管理软件开发成为目前工业管理软件开发的难点。大多数工业管理软件在复杂业务场景中存在大量相同的事务处理过程,为了加快软件开发效率,基于组件的软件开发成为目前的主流方式之一。目前存在的可复用组件挖掘方法主要是从面向对象的API中通过使用频率进行挖掘,在工业管理软件领域实用性不强。针对工业管理软件系统的特点,面向业务流程进行流程相似性分析,从业务流中自动挖掘相似子流程集合作为该软件的一个组件模块,可以在保证组件质量的前提下大大提高构建组件的速度,从而更好地利用软件复用技术进行工业管理软件开发。
技术实现思路
本专利技术解决现有技术中工业软件由于业务场景复杂,导致的开发速度慢,效率低的问题。本专利技术技术方案为,一种面向复杂业务流程的可复用组件挖掘方法,包括以下步骤:S1、输入系统的业务流程图集,通过预处理将业务流程图集转换为以符号表示的图模型集合;S2、通过图模型集合挖掘结构相似的频繁子流程,所有结构相似的频繁子流程组成集合,;S3、计算集合中频繁子流程的行为相似度,根据相似度对集合进行聚类,形成组件备选集合;S4、对所有组件备选集合基于复用组件的可行性进行评估,计算备选集合构成组件的可行性;S5、根据可行性判断组件备选集合是否满足可行性指标,若大于等于可行性指标则构建可复用组件,否则放弃构建组件。进一步地,所述步骤S1包括:S11、将业务流程图集中各流程图节点转换为三元组Node=(nId,nLabel,nText),其中nId表示该节点的唯一标识号;nLabel表示该节点在流程中的所处状态对应值;nText表示该节点的具体行为描述;S12、将流程图连线转换为四元组Edge=(eId,nFrom,nTo,eLable),其中eId表示该连线的唯一标识号;nFrom表示该连线的起始节点唯一标识号;nTo表示该连线的目的节点唯一标识号;eLable表示该连线的状态,目的是为了区分普通连线和条件连线;S13、结合S11和S12所得结果,将业务流程图转换为符号表示的图模型G=(N,E),其中N为三元组的Node集合,E为四元组Edge的集合。进一步地,所述步骤S2包括:S21、统计相同功能的边和节点出现的频率,根据预先设定的最小支持度min_spt,移除频率小于最小支持度min_spt的节点和边,得到新的图模型;根据边的eLable和节点的nLabel来确定边和节点的功能是否相同;S22、对上述图模型中的边和节点以频次分类进行重新标记,标记的规则按照频次高低,频次越高标记对应的字典序越小,相同频次的边或节点字标记相同,同时,保存标识号和标记之间的映射关系以及标记边与原始边的对应关系;S23、选取频次最高的标记,该标记对应的边和节点组成最大频繁子流程A,对最大频繁子流程A进行挖掘,每次挖掘出一个频繁子流程;S24、按照步骤S23的方法挖掘完依次挖掘第二高的频次的标记,再是第三高频次的标记,直到挖掘完所有频繁子流程,得到频繁子流程集合。进一步地,所述步骤S23包括:S231、最大频繁子流程A为第一个频繁子流程,随后每个频繁子流程都在前一个频繁子流程上减少一条边;判断当前频繁子流程是否满足最小DFS编码;S232、如果不满足最小DFS编码,则此子流程的挖掘过程结束;S233、如果满足最小DFS编码,对频繁子流程进行最右路扩展,得到新的频繁子流程;最右路扩展的方法为:给定图G和G的DFS树T,所述的树T为图G被访问过的顶点集合反复扩展,直到建立一个完全的DFS树,将一条新边e添加到最右节点和最右路径上另一个节点之间,或者引进一个新的节点并且连接到最右路径上的节点;S234、判断新的频繁子流程是否满足最小支持度min_spt,若满足将新的频繁子流程存储到频繁子流程集合中;进一步地,所述步骤S3包括:S31、计算两个频繁子流程的节点语义相似度;S32、根据频繁子流程节点语义相似度,加入层级影响因子,计算频繁子流程的行为相似度;S33、采用层次聚类算法对频繁子流程进行聚类,形成组件备选集合。进一步地,所述步骤S31包括:S311、使用Word2Vec训练模型,将节点和节点的信息语义向量化,得到和;S312、设定节点语义中名词的权重,计算子流程中的节点语义相似度,记为:S313、采用S311和S312的方法将两个频繁子流程中所有节点两两计算语义相似度。进一步地,所述步骤S32包括:S321、计算频繁子流程各层的层级影响因子,其中n代表频繁子流程的图模型深度:S322、表示频繁子流程在第i层的节点集合,表示集合中的元素个数;和分别表示频繁子流程和频繁子流程在第i层的第j个节点,根据节点相似度,计算子流程的层级相似度:S323、综合考虑层级相似度与层级影响因子,计算具有n层的频繁子流程与频繁子流程之间的行为相似度:。进一步地,所述步骤S33包括:S331、基于频繁子流程行为相似度计算聚类簇与的距离:S332、每个频繁子流程看作一个初始聚类簇;S333、找出距离最近的两个聚类簇进行合并,该过程不断重复,直到所有频繁子流程成为一个聚类簇;S334、记录聚类的过程中每一个层次的聚类簇划分结果,形成组件备选集合。进一步地,所述步骤4的具体方法为:S41、计算组件备选集合的簇内相似度ICS(C):其中,表示第j个频繁子流程;S42、统计组件备选集合中出现在同一原流程图中的子流程个数,记为;S43、统计组件备选集合中出现在不同原流程图中的子流程个数,记为;S44、设k为组件备选集合中的集合个数,,设定全局重合率权重和局部重合率权重,计算组件备选集合的组件重合率:其中:加权子流程个数相似数S45、考虑簇内相似度以及重合率,计算组件备选集合作为组件的可行性:。进一步地,所述步骤S5包括:S51、设定组件可行性指标,判断组件备选集合是否满足可行性指标;S52、若大于等于可行性指标则输出备选集合,构建可复用组件;S53、若小于可行性指标则放弃构建组件。有益效果工业管理软件系统在各个业务场景中存在大量相同的事务处理过程,该专利技术面向业务流程进行流程相似性分析,可以从本文档来自技高网...

【技术保护点】
1.一种面向复杂业务流程的可复用组件挖掘方法,其特征在于,该方法包括以下步骤:/nS1、输入系统的业务流程图集,通过预处理将业务流程图集转换为以符号表示的图模型集合;/nS2、通过图模型集合挖掘结构相似的频繁子流程,所有结构相似的频繁子流程

【技术特征摘要】
1.一种面向复杂业务流程的可复用组件挖掘方法,其特征在于,该方法包括以下步骤:
S1、输入系统的业务流程图集,通过预处理将业务流程图集转换为以符号表示的图模型集合;
S2、通过图模型集合挖掘结构相似的频繁子流程,所有结构相似的频繁子流程组成
集合,;
S3、计算集合中频繁子流程的行为相似度,根据相似度对集合进行聚类,形成组件
备选集合;
S4、对所有组件备选集合基于复用组件的可行性进行评估,计算备选集合构成组件的
可行性;
S5、根据可行性判断组件备选集合是否满足可行性指标,若大于等于可行性指标则构
建可复用组件,否则放弃构建组件。


2.如权利要求1所述的一种面向复杂业务流程的可复用组件挖掘方法,其特征在于,所述步骤S1包括:
S11、将业务流程图集中各流程图节点转换为三元组Node=(nId,nLabel,nText),其中nId表示该节点的唯一标识号;nLabel表示该节点在流程中的所处状态对应值;nText表示该节点的具体行为描述;
S12、将流程图连线转换为四元组Edge=(eId,nFrom,nTo,eLable),其中eId表示该连线的唯一标识号;nFrom表示该连线的起始节点唯一标识号;nTo表示该连线的目的节点唯一标识号;eLable表示该连线的状态,目的是为了区分普通连线和条件连线;
S13、结合S11和S12所得结果,将业务流程图转换为符号表示的图模型G=(N,E),其中N为三元组的Node集合,E为四元组Edge的集合。


3.如权利要求1所述的一种面向复杂业务流程的可复用组件挖掘方法,其特征在于,所述步骤S2包括:
S21、统计相同功能的边和节点出现的频率,根据预先设定的最小支持度min_spt,移除
频率小于最小支持度min_spt的节点和边,得到新的图模型;根据边的eLable和节点的nLabel来确定边和节点的功能是否相同;
S22、对上述图模型中的边和节点以频次分类进行重新标记,标记的规则按照频次高
低,频次越高标记对应的字典序越小,相同频次的边或节点字标记相同,同时,保存标识号
和标记之间的映射关系以及标记边与原始边的对应关系;
S23、选取频次最高的标记,该标记对应的边和节点组成最大频繁子流程A,对最大频繁
子流程A进行挖掘,每次挖掘出一个频繁子流程;
S24、按照步骤S23的方法挖掘完依次挖掘第二高的频次的标记,再是第三高频次的标
记,直到挖掘完所有频繁子流程,得到频繁子流程集合。


4.如权利要求1所述的一种面向复杂业务流程的可复用组件挖掘方法,其特征在于,所述步骤S3包括:
S31、计算两个频繁子流程的节点语义相似度;
S32、根据频繁子流程节点语义相似度,加入层级影响因子,计算频繁子流程的行为相似度;
S33、采用层次聚类算法对频繁子流程进行聚类,形成组件备选集合。


5.如权利要求1所述的一种面向复杂业务流程的可复用组件挖掘方法,其特征在于,所述步骤4的具体方法为:
S41、计算组件备选集合的簇内相似度ICS(C):



其中,表示第j个频繁子流程;
S42、统计组件备选集合中聚类簇出现在...

【专利技术属性】
技术研发人员:潘鑫李贞昊雷航荣燊李若尘柳叶康肖泾军
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1