根据时间片分布数据确定事务流经渠道的对应关系的方法技术

技术编号:9928643 阅读:163 留言:0更新日期:2014-04-16 19:18
本发明专利技术涉及关联审计领域,旨在提供根据时间片分布数据确定事务流经渠道的对应关系的方法。该根据时间片分布数据确定事务流经渠道的对应关系的方法,首先每个事务经过阶段PA和PB的流经渠道时,自动采集产生的行为事件记录,行为事件记录包括:记录编号、记录产生时间、行为类别特征、行为发生时间;然后根据采集的行为事件记录,获得阶段PA、PB的流经渠道之间的正式对应关系。本发明专利技术解决了在关联审计时,在无法预知前后阶段的流经渠道对应关系的情况下,逆向构建出工作流程模型的难题,将审计从单个环节的审计,提升到了整体工作流程的审计,为审计业务的发展和提升建立了技术基础。

【技术实现步骤摘要】
根据时间片分布数据确定事务流经渠道的对应关系的方法
本专利技术是关于关联审计领域,特别涉及根据时间片分布数据确定事务流经渠道的对应关系的方法。
技术介绍
在IT行业内,只能获得工作流程中前后两个业务环节(事务流经渠道)的日志记录,而不能获得先行业务环节(事务流经渠道)的多个行为事件类型与后发业务环节(事务流经渠道)的多个行为事件类型之间的对应关系。但是,明确两个业务环节(事务流经渠道)的对应关系,对于整体工作流程的审计工作具有非常重要的意义。关联审计的目标,要求获得尽可能正确的前后两个环节的行为事件类型的对应关系,通过逆向构建数学模型的方式,提供尽可能正确的工作流程模型,最终提供相应的审计记录。当前,在IT行业内,用于解决上述审计系统的逆向构建工作流程模型的技术相当缺乏,经过技术实践并在正式技术产品中正式实现,实现对工作流程模型逆向构建的技术更是缺乏。业务流程、数据流程都可用于描述多个工作环节经过有机整合进而完成一系列工作目标的工作系统。流程可包括多个环节,环节是对其中部分工作的一个概括说明,是工作流程中的一个步骤。每个环节的工作,都是一种或者多种行为,而行为可产生记录,这个记录称之为事件或者行为事件记录。环节也可称之为阶段。行为可通过类别进行区分,也可称之为渠道。在流程中,不同的环节之间存在着多种关系,包括但不限于:前后依赖关系、共同前置环节的兄弟分支关系、相互独立关系、同时并行执行关系、互斥执行关系等等。一个流程就相当于一个状态机,一个环节就相当于状态机中的一个节点,环节之间的关系就是状态机中的相互关系。一个事务在按照流程进行执行的时候,在流程中所经过的环节、将要流经的环节,都具有可理解、可识别的强逻辑关系,尤其是相邻环节的前后关联关系;而流经某个环节时,必然经过该阶段的某种渠道。而在工作系统的每个阶段的渠道只产生自身行为事件记录的情况下,预先不知道前后阶段的相应渠道的对应关系,需要对系统运行状况进行审计。而在现有技术中,用于解决上述审计系统的逆向构建工作流程模型的技术相当缺乏。因此提出能实现对工作流程模型进行逆向构建的方法,能经过技术实践并在正式技术产品中正式实现,具有重大的意义。不仅仅可应用于审计领域,还可用于在大数据分析中,建立用户行为的关联,对复杂情况下的数据关联分析也拥有良好的应用前景。
技术实现思路
本专利技术的主要目的在于提供一种通过自动采集行为事件记录,进而逆向建立前后阶段之间的对应关系的数据关联分析方法。为解决上述技术问题,本专利技术的解决方案是:提供根据时间片分布数据确定事务流经渠道的对应关系的方法,用于确定事务经过两个阶段的流经渠道之间的对应关系,流经渠道能产生行为事件记录,假设有P种事务经过两个明确前后关系的阶段,P种事务分别设为T1,T2,T3,…Tp,两个阶段从前到后依次为阶段PA和PB,经过阶段PA时,必须经过M个不同的流经渠道中的任意一个,设为RA1,RA2,RA3,…RAm,事务经过阶段PB时,必须经过N个不同的流经渠道中的任意一个,设为RB1,RB2,RB3,…RBn,每种事务对应于阶段PA、阶段PB的流经渠道是固定的,并且不同事务所对应的流经渠道不同;其中,M、N、P、m、n、p是指自然数,P不大于M,P不大于N;根据时间片分布数据确定事务流经渠道的对应关系的方法,首先每个事务经过阶段PA和PB的流经渠道时,自动采集产生的行为事件记录,行为事件记录包括:记录编号、记录产生时间、行为类别特征、行为发生时间;然后根据采集的行为事件记录,获得阶段PA、PB的流经渠道之间的正式对应关系,具体包括以下步骤:1)按照阶段对流经渠道进行编号,建立两个流经渠道编号变量数组ArrayChannelA:[RA1,RA2,RA3,…RAm]和ArrayChannelB:[RB1,RB2,RB3,…RBn];2)将所有行为事件记录,转化成为行为事件记录结构的数组ArrayRecordTotal:[ActRecd1,ActRecd2,ActRecd3,…ActRecdT],其中T是指自然数,行为事件记录ActRecd的数据结构包括:行为事件编号、流经渠道编号、发生时间、行为类型;其中,行为事件编号采用从1开始递增的自然数进行编号(比如:1,2,3,…);流经渠道编号即为步骤1中的设置的编号;发生时间采用Linux下的time_t类型来表示,并能通过转换获得各种格式的时间描述;行为类型采用整数类型来标识,保证每种行为拥有唯一的标识数值(比如100,203等等);3)获取行为事件记录的发生时间中的最早时间和最晚时间,分别保存在相应变量TimeStt、TimeEnd中;4)根据需要设定时间粒度大小(大于等于1秒),即单位时间段长度,保存在变量TimeSlot中;5)将TimeStt、TimeEnd所覆盖的时间段,即目标时间段,按照时间粒度大小TimeSlot,分成连续时间片,每个时间片的长度为时间粒度指定的长度,并对时间片按照顺序从1进行连续编号,形成时间片序列,并保存在相应变量数组ArrayTimeSlot[TimeSlot1,TimeSlot2,…]中,以供后续过程中获取时间片相关信息时使用;6)遍历ArrayRecordTotal,根据每个行为事件记录的发生时间分别对应到步骤5中的时间片,将对应的时间片编号标记到当前行为事件记录上;7)遍历ArrayChannelA和ArrayChannelB,对每个流经渠道编号Rxx,Rxx是指属于ArrayChannelA或者ArrayChannelB的流经渠道编号,完成以下工作:a、从ArrayRecordTotal中筛选出当前流经渠道编号的行为事件记录;b、对当前流经渠道编号,按照时间片编号统计属于各个时间片的行为事件记录的数量,形成数组ArrayChannelSlotOccur[Rxx_Occur_1,Rxx_Occur_2,…],记录当前流经渠道在每个时间片上发生的行为事件的数量;8)经过步骤7,最终得到对于所有流经渠道编号的两组数组:[ArrayChannelSlotOccur_RA1,ArrayChannelSlotOccur_RA2,ArrayChannelSlotOccur_RA3,…,ArrayChannelSlotOccur_RAm]和[ArrayChannelSlotOccur_RB1,ArrayChannelSlotOccur_RB2,ArrayChannelSlotOccur_RB3,…,ArrayChannelSlotOccur_RBn]);9)遍历步骤8中得到的阶段PA和PB的所有流经渠道编号的两组数组,在两组之间,对不同流经渠道对,即一个阶段PA的流经渠道与一个阶段PB的流经渠道组成一对,然后对这两个流经渠道对应的数组ArrayChannelSlotOccur_RAx、ArrayChannelSlotOccur_RBy进行偏离度的计算,获得偏离度的量化指标Variance,并将结果保存到二维数组Array2Match中,Array2Match[x][y]的值表示流经渠道编号RAx对应的“时间片记录数量数组”与流经渠道编号RBy对应的“时间片记录数量数组”的偏离度比较结果,其中x、y是指自然数;10)对于阶段A的任何一个本文档来自技高网
...
根据时间片分布数据确定事务流经渠道的对应关系的方法

【技术保护点】
根据时间片分布数据确定事务流经渠道的对应关系的方法,用于确定事务经过两个阶段的流经渠道之间的对应关系,流经渠道能产生行为事件记录,其特征在于,假设有P种事务经过两个明确前后关系的阶段,P种事务分别设为T1,T2,T3,…Tp,两个阶段从前到后依次为阶段PA和PB,经过阶段PA时,必须经过M个不同的流经渠道中的任意一个,设为RA1,RA2,RA3,…RAm,事务经过阶段PB时,必须经过N个不同的流经渠道中的任意一个,设为RB1,RB2,RB3,…RBn,每种事务对应于阶段PA、阶段PB的流经渠道是固定的,并且不同事务所对应的流经渠道不同;其中,M、N、P、m、n、p是指自然数,P不大于M,P不大于N;根据时间片分布数据确定事务流经渠道的对应关系的方法,首先每个事务经过阶段PA和PB的流经渠道时,自动采集产生的行为事件记录,行为事件记录包括:记录编号、记录产生时间、行为类别特征、行为发生时间;然后根据采集的行为事件记录,获得阶段PA、PB的流经渠道之间的正式对应关系,具体包括以下步骤:1)按照阶段对流经渠道进行编号,建立两个流经渠道编号变量数组ArrayChannelA:[RA1,RA2,RA3,…RAm]和ArrayChannelB:[RB1,RB2,RB3,…RBn];2)将所有行为事件记录,转化成为行为事件记录结构的数组ArrayRecordTotal:[ActRecd1,ActRecd2,ActRecd3,…ActRecdT],其中T是指自然数,行为事件记录ActRecd的数据结构包括:行为事件编号、流经渠道编号、发生时间、行为类型;其中,行为事件编号采用从1开始递增的自然数进行编号;流经渠道编号即为步骤1中的设置的编号;发生时间采用Linux下的time_t类型来表示,并能通过转换获得各种格式的时间描述;行为类型采用整数类型来标识,保证每种行为拥有唯一的标识数值;3)获取行为事件记录的发生时间中的最早时间和最晚时间,分别保存在相应变量TimeStt、TimeEnd中;4)根据需要设定时间粒度大小,即单位时间段长度,保存在变量TimeSlot中;5)将TimeStt、TimeEnd所覆盖的时间段,即目标时间段,按照时间粒度大小TimeSlot,分成连续时间片,每个时间片的长度为时间粒度指定的长度,并对时间片按照顺序从1进行连续编号,形成时间片序列,并保存在相应变量数组ArrayTimeSlot[TimeSlot1,TimeSlot2,…]中,以供后续过程中获取时间片相关信息时使用;6)遍历ArrayRecordTotal,根据每个行为事件记录的发生时间分别对应到步骤5中的时间片,将对应的时间片编号标记到当前行为事件记录上;7)遍历ArrayChannelA和ArrayChannelB,对每个流经渠道编号Rxx,Rxx是指属于ArrayChannelA或者ArrayChannelB的流经渠道编号,完成以下工作:a、从ArrayRecordTotal中筛选出当前流经渠道编号的行为事件记录;b、对当前流经渠道编号,按照时间片编号统计属于各个时间片的行为事件记录的数量,形成数组ArrayChannelSlotOccur[Rxx_Occur_1,Rxx_Occur_2,…],记录当前流经渠道在每个时间片上发生的行为事件的数量;8)经过步骤7,最终得到对于所有流经渠道编号的两组数组:[ArrayChannelSlotOccur_RA1,ArrayChannelSlotOccur_RA2,ArrayChannelSlotOccur_RA3,…,ArrayChannelSlotOccur_RAm]和[ArrayChannelSlotOccur_RB1,ArrayChannelSlotOccur_RB2,ArrayChannelSlotOccur_RB3,…,ArrayChannelSlotOccur_RBn]);9)遍历步骤8中得到的阶段PA和PB的所有流经渠道编号的两组数组,在两组之间,对不同流经渠道对,即一个阶段PA的流经渠道与一个阶段PB的流经渠道组成一对,然后对这两个流经渠道对应的数组ArrayChannelSlotOccur_RAx、ArrayChannelSlotOccur_RBy进行偏离度的计算,获得偏离度的量化指标Variance,并将结果保存到二维数组Array2Match中,Array2Match[x][y]的值表示流经渠道编号RAx对应的“时间片记录数量数组”与流经渠道编号RBy对应的“时间片记录数量数组”的偏离度比较结果,其中x、y是指自然数;10)对于阶段A的任何一个流经渠道编号RAx,选择Array2Match二维数组中所有第一维度下标为x的数据项,选择其中数值最小的项作为胜出者,该数据项对应的下标第二维度的下...

【技术特征摘要】
1.根据时间片分布数据确定事务流经渠道的对应关系的方法,用于确定事务经过两个阶段的流经渠道之间的对应关系,流经渠道能产生行为事件记录,其特征在于,假设有P种事务经过两个明确前后关系的阶段,P种事务分别设为T1,T2,T3,…Tp,两个阶段从前到后依次为阶段PA和PB,经过阶段PA时,必须经过M个不同的流经渠道中的任意一个,设为RA1,RA2,RA3,…RAm,事务经过阶段PB时,必须经过N个不同的流经渠道中的任意一个,设为RB1,RB2,RB3,…RBn,每种事务对应于阶段PA、阶段PB的流经渠道是固定的,并且不同事务所对应的流经渠道不同;其中,M、N、P、m、n、p是指自然数,P不大于M,P不大于N;根据时间片分布数据确定事务流经渠道的对应关系的方法,首先每个事务经过阶段PA和PB的流经渠道时,自动采集产生的行为事件记录,行为事件记录包括:记录编号、记录产生时间、行为类别特征、行为发生时间;然后根据采集的行为事件记录,获得阶段PA、PB的流经渠道之间的正式对应关系,具体包括以下步骤:1)按照阶段对流经渠道进行编号,建立两个流经渠道编号变量数组ArrayChannelA:[RA1,RA2,RA3,…RAm]和ArrayChannelB:[RB1,RB2,RB3,…RBn];2)将所有行为事件记录,转化成为行为事件记录结构的数组ArrayRecordTotal:[ActRecd1,ActRecd2,ActRecd3,…ActRecdT],其中T是指自然数,行为事件记录ActRecd的数据结构包括:行为事件编号、流经渠道编号、行为发生时间、行为类型;其中,行为事件编号采用从1开始递增的自然数进行编号;流经渠道编号即为步骤1)中的设置的编号;行为发生时间采用Linux下的time_t类型来表示,并能通过转换获得各种格式的时间描述;行为类型采用整数类型来标识,保证每种行为拥有唯一的标识数值;3)获取行为事件记录的记录产生时间中的最早时间和最晚时间,分别保存在相应变量TimeStt、TimeEnd中;4)根据需要设定时间粒度大小,即单位时间段长度,保存在变量TimeSlot中;5)将TimeStt、TimeEnd所覆盖的时间段,即目标时间段,按照时间粒度大小TimeSlot,分成连续时间片,每个时间片的长度为时间粒度指定的长度,并对时间片按照顺序从1进行连续编号,形成时间片序列,并保存在相应变量数组ArrayTimeSlot[TimeSlot1,TimeSlot2,…,TimeSlotv]中,以供后续过程中获取时间片相关信息时使用;其中,v是指自然数;6)遍历ArrayRecordTotal,根据每个行为事件记录的行为发生时间分别对应到步骤5)中的时间片,将对应的时间片编号标记到当前行为事件记录上;7)遍历ArrayChannelA和ArrayChannelB,对每个流经渠道编号Rxx,Rxx是指属于ArrayChannelA或者ArrayChannelB的流经渠道编号,完成以下工作:a、从ArrayRecordTotal中筛选出当前流经渠道编号的行为事件记录;b、对当前流经渠道编号,按照时间片编号统计属于各个时间片的行为事件记录的数量,形成数组ArrayCh...

【专利技术属性】
技术研发人员:王锦龙范渊杨永清
申请(专利权)人:杭州安恒信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1