一种基于RPA分解日志自动化流程挖掘的方法技术

技术编号:34624447 阅读:17 留言:0更新日期:2022-08-20 09:32
本发明专利技术涉及一种基于RPA分解日志自动化流程挖掘的方法,包括系统构建,系统设置,数据分流及数据挖掘处理等四个步骤。本发明专利技术有效实现了流程挖掘和RPA技术二者协同互补,通过RPA配置日志解析的规则,实现自动化抽取日志、日志拆分,从而极大提高了流程挖掘的运行效率;同时有效改善流程所需的完整环境和端到端视角,大大提高自动化效益;并有效实现流程挖掘与自动化评估相结合,持续提高监测RPA的自动化效率、流程合规性、其他KPI和投资回报率。其他KPI和投资回报率。其他KPI和投资回报率。

【技术实现步骤摘要】
一种基于RPA分解日志自动化流程挖掘的方法


[0001]本专利技术涉及一种基于RPA分解日志自动化流程挖掘的方法,属人工智能及信息


技术介绍

[0002]在大数据不断发展,人们日常生活逐渐数字化的今天,日常接收到的数据量呈爆炸式的增长,并且随着各个企业的内部网络环境和管理系统走向成熟,记录大量用户行为信息的系统日志被保存收集,而这部分用户行为数据背后包含着对公司来说非常具有管理意义的信息,正有待分析挖掘。流程挖掘需要我们自动的从商业日志中获取到商业流程模型,因此被建造出来的流程模型必须真实准确反映这个日志中的所有信息。然而流程挖掘技术在应用于大型事件日志时,在计算需求和生成输出的可解释性方面都存在可伸缩性的问题,因为从大型事件日志中发现的流程模型通常向企业提供的有价值信息比较具有局限性。大多数流程挖掘技术是将一个大型日志直接按照业务活动流的活动顺序行程相对平滑的流程模型,但实际情况指出在遇到大数据集的时候往往会产生适应性方面的问题,这种普通流程挖掘方式经常导致产生非常巨大且复杂的流程模型,同时伴随着低重放适应性度和低精度,他们是衡量流程挖掘质量的重要量化指标,另外还有泛化性和简化行两个量化指标,流程挖掘算法会用其中不同的一两个量化指标做为基准。其中重放适应性数字化反映了挖掘的模型能够准确地再现数据日志中记录的案例的能力,低重放适应度将导致挖掘获得的模型不能重新形成及表示出原始的行为日志,但是过高追求重放适应性可能会造成比较复杂的模型。精确度量化了流程模型中描述日志行为的准确程度,低精确度将会导致挖掘出欠拟合的模型。
[0003]因此针对这一问题,迫切需要开发一种全新的光纤表面质量检测设备及检测方法,以满足实际使用的需要。

技术实现思路

[0004]为了解决现有技术上的不足,本专利技术提供一种基于RPA分解日志自动化流程挖掘的方法。
[0005]一种基于RPA分解日志自动化流程挖掘的方法,包括如下步骤:S1,系统构建,首先构建一个基于大数据计算为基础的数据处理服务器,同时构建若干数据挖掘终端机若干RPA机器人终端,所述基于大数据计算为基础的数据处理服务器通过通讯网络分别与若干数据挖掘终端机建立数据连接,且各数据挖掘终端机间相互并联,同时每个数据挖掘终端机均通过通讯网关与1—4个RPA机器人终端间建立数据连接,且同一数据挖掘终端机所连接的各RPA机器人终端间通过通讯网关相互连接;基于大数据计算为基础的数据处理服务器另通过通讯接口与1个RPA机器人终端建立数据连接,同时将基于大数据计算为基础的数据处理服务器和各数据挖掘终端机分别通过通讯网络与外部工作数据网络建立数据连接;
S2,系统设置,完成S1步骤后,首先在基于大数据计算为基础的数据处理服务器中设置数据处理软件系统、日志文件处理软件系统;在数据挖掘终端机中录入日志文件处理软件系统,然后分别在基于大数据计算为基础的数据处理服务器和据挖掘终端机中分别录入日志数据管理程序、日志数据存储程序、数据筛选程序、日志文件分解控制策略;S3,数据分流,首先由基于大数据计算为基础的数据处理服务器和各数据挖掘终端机通过通讯网络分别对工作数据网络在日常工作中产生的日志文件进行收集汇总,同时各数据挖掘终端机采集的日志文件均传输至基于大数据计算为基础的数据处理服务器内,由基于大数据计算为基础的数据处理服务器对接收的各日志文件根据S2步骤设置的日志数据管理程序、日志数据存储程序、进行预处理并存储;然后由基于大数据计算为基础的数据处理服务器所连接的RPA机器人终端根据S2步骤设置数据筛选程序、日志文件分解控制策略对各日志文件进行分流;最后将分流后的数据分别发送至各数据挖掘终端机内;S4,数据挖掘处理,将分流至各数据挖掘终端机的日志文件数据,由数据挖掘终端机根据S2步骤设定的日志数据管理程序、日志数据存储程序、数据筛选程序、日志文件分解控制策略,由其连接的各RPA机器人终端对当前的日志文件数据进行分析处理,最后将分析处理结果集中汇总至基于大数据计算为基础的数据处理服务器,由基于大数据计算为基础的数据处理服务器对各数据挖掘终端机传输的数据进行会中处理,即可得到完整的数据挖掘分析结果。
[0006]进一步的,所述S2步骤中设定的日志文件分解控制策略中包括基于BPMN是BPM及workflow的建模中任意一种或几种共用的数据建模系统,且日志数据管理程序、日志数据存储程序、数据筛选程序、日志文件分解控制策略和数据处理软件系统、日志文件处理软件系统均纳入统一的软件栈中。
[0007]进一步的,所述S4步骤在进行数据挖掘处理时,第一阶段,RPA机器人终端根据日志文件分解控制策略,由RPA机器人终端将采集业务流程中的元数据并进行数据预处理,在RPA中设定需保留的数据项和需删除的数据项,筛选出流程挖掘用到的元数据,包含案例、事件、时间戳,删除流程中特定的业务数据,最终获得的事件日志是适用于事件流程图来构造的形式;第二阶段,将根据业务流程相中的事件ID,时间戳进行度量,建造出更加反映实际数据形式的事件流程图,将第一步采集的原始元数据集建模为一个有初始节点和结束节点的有向加权图的形式;第三阶段,对事件流程图进行聚类划分,最终得到划分为不同阶段的流程活动集,并在活动流程之上再次挖掘出子流程图并进行合并,得出流程自动化所达到的最终效果。
[0008]进一步的,所述子流程集处理时,按以下三个步骤进行:第一步,子流程图挖掘,首先基于前面流程分解步骤中的输出,得到了一组流程集的分解,每个分解集中都会存在一个分解点,这个分解点是两个相邻流程的分界线,并会在下一个分解集中也存储一个拷贝,以表明它是本阶段和上一阶段之间的分解点,按照活动事件所属的分解将数据集分成不同的数据子集,每个子集只包含分解内部的流程信息,然后对于这些流程子集进行再一次的流程图构建,将构建基于时间戳,允许活动并行发生的流程图;第二步,子图聚合,在第一步得到子模型后,初步拟定为每一个子模型内部存在的
分解点,将分解点与下一个子模型的初始点进行连接,使两个子模型合并起来;第三步,聚合图简化与完善,经过第二步得到聚合图以后,一方面再返回至S3步骤,核对是否有被忽略、误删除作业;另一方面还需要再添加额外的边集数据,实现各模块之间连接的交互边。
[0009]进一步的,所述RPA机器人终端包括承载壳、辅助驱动电源、数据通讯端口、数据处理电路、数据存储电路、操控界面及绝缘隔板,其中所述承载壳为轴向截面呈矩形的闭合腔体结构,所述绝缘隔板嵌于承载壳内并将承载壳内均分为若干工作腔,其中所述辅助驱动电源、数据处理电路、数据存储电路分别嵌于一个工作腔内,并均与绝缘隔板相互连接,所述操控界面嵌于承载壳上端面,数据通讯端口若干并均嵌于承载壳前端面,所述数据存储电路分别与辅助驱动电源、数据通讯端口、数据处理电路、数据存储电路、操控界面间电气连接,且数据处理电路通过数据通讯端口与外部设备间建立数据连接。
[0010]进一步的,所述承载壳下端面设至少两条导向柱,上端面设至少一个横断面呈矩形闭合腔体结构的储物腔,其中所述导向柱对称分布在承载壳轴本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于RPA分解日志自动化流程挖掘的方法,其特征在于,所述的基于RPA分解日志自动化流程挖掘的方法包括如下步骤:S1,系统构建,首先构建一个基于大数据计算为基础的数据处理服务器,同时构建若干数据挖掘终端机若干RPA机器人终端,所述基于大数据计算为基础的数据处理服务器通过通讯网络分别与若干数据挖掘终端机建立数据连接,且各数据挖掘终端机间相互并联,同时每个数据挖掘终端机均通过通讯网关与1—4个RPA机器人终端间建立数据连接,且同一数据挖掘终端机所连接的各RPA机器人终端间通过通讯网关相互连接;基于大数据计算为基础的数据处理服务器另通过通讯接口与1个RPA机器人终端建立数据连接,同时将基于大数据计算为基础的数据处理服务器和各数据挖掘终端机分别通过通讯网络与外部工作数据网络建立数据连接;S2,系统设置,完成S1步骤后,首先在基于大数据计算为基础的数据处理服务器中设置数据处理软件系统、日志文件处理软件系统;在数据挖掘终端机中录入日志文件处理软件系统,然后分别在基于大数据计算为基础的数据处理服务器和据挖掘终端机中分别录入日志数据管理程序、日志数据存储程序、数据筛选程序、日志文件分解控制策略;S3,数据分流,首先由基于大数据计算为基础的数据处理服务器和各数据挖掘终端机通过通讯网络分别对工作数据网络在日常工作中产生的日志文件进行收集汇总,同时各数据挖掘终端机采集的日志文件均传输至基于大数据计算为基础的数据处理服务器内,由基于大数据计算为基础的数据处理服务器对接收的各日志文件根据S2步骤设置的日志数据管理程序、日志数据存储程序、进行预处理并存储;然后由基于大数据计算为基础的数据处理服务器所连接的RPA机器人终端根据S2步骤设置数据筛选程序、日志文件分解控制策略对各日志文件进行分流;最后将分流后的数据分别发送至各数据挖掘终端机内;S4,数据挖掘处理,将分流至各数据挖掘终端机的日志文件数据,由数据挖掘终端机根据S2步骤设定的日志数据管理程序、日志数据存储程序、数据筛选程序、日志文件分解控制策略,由其连接的各RPA机器人终端对当前的日志文件数据进行分析处理,最后将分析处理结果集中汇总至基于大数据计算为基础的数据处理服务器,由基于大数据计算为基础的数据处理服务器对各数据挖掘终端机传输的数据进行会中处理,即可得到完整的数据挖掘分析结果。2.根据权利要求1所述的一种基于RPA分解日志自动化流程挖掘的方法,其特征在于,所述S2步骤中设定的日志文件分解控制策略中包括基于BPMN是BPM及workflow的建模中任意一种或几种共用的数据建模系统,且日志数据管理程序、日志数据存储程序、数据筛选程序、日志文件分解控制策略和数据处理软件系统、日志文件处理软件系统均纳入统一的软件栈中。3.根据权利要求1所述的一种基于RPA分解日志自动化流程挖掘的方法,其特征在于,所述S4步骤在进行数据挖掘处理时,第一阶段,RPA机器人终端根据日志文件分解控制策略,由RPA机器人终端将采集业务流程中的元数据并进行数据预处理,在RPA中设定需保留的数据项和需删除的数据项,筛选出流程挖掘用到的元数据,包含案例、事件、时间戳,删除流程中特定的业务数据,最终获得的事件日志是适用于事件流程图来构造的形式;第二阶段,将...

【专利技术属性】
技术研发人员:叶海亮钟锐
申请(专利权)人:南京英诺森软件科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1