当前位置: 首页 > 专利查询>魏磊专利>正文

基于语义分析的计算机流程分析挖掘系统及方法技术方案

技术编号:26690322 阅读:43 留言:0更新日期:2020-12-12 02:40
本发明专利技术计算机技术领域,具体涉及基于语义分析的计算机流程分析挖掘系统及方法。需求语义分析单元,配置用于对用户的分析需求进行语义分析,得到需求语义分析结果;日志神经网络综合处理单元,配置用于根据语义分析结果,对计算机内的日志进行挖掘分析处理,生成分析结果;其基于用户需求的语义分析,针对计算机系统中的日志进行内容挖掘和分析,大幅度提升了计算机流程分析的准确率,同时提升了计算机流程分析的效率。

【技术实现步骤摘要】
基于语义分析的计算机流程分析挖掘系统及方法
本专利技术属于计算机
,具体涉及基于语义分析的计算机流程分析挖掘系统及方法。
技术介绍
信息系统被广泛运用于制造业等领域的企业生产、运作、流程监控以及优化,对企业的业务活动提供有效的管理和支持。信息系统在运行过程中产生了大量的日志文件,能够直接反映出业务流程中任务实际运行情况和资源的分配。流程挖掘作为业务流程管理中的重要辅助手段,用于从信息系统生成的日志文件中检查和改进已有的流程模型,纠正系统构建过程中的主观性,分析企业生产和运作过程的资源利用情况,促进企业流程优化和资源调度。现有的基于Petri网基本结构的过程模型修复方法,主要通过对原有数据进行处理,使其成为符合规范的事件日志;之后对其使用归纳挖掘算法挖掘出对应的过程模型;通过将扩大的事件日志与挖掘得到的过程模型进行校准,发现过程模型中存在的偏差;最后提出了不同结构下过程模型的修复方案,旨在修复过程模型,增强过程模型的一致性。但这些技术只是采用了一种算法,从控制流角度完成了事件日志的Petri模型发现和模型校准,其本身不具备分析和匹配用户需求本文档来自技高网...

【技术保护点】
1.基于语义分析的计算机流程分析挖掘系统,其特征在于,所述系统包括:需求语义分析单元,配置用于对用户的分析需求进行语义分析,得到需求语义分析结果;日志神经网络综合处理单元,配置用于根据语义分析结果,对计算机内的日志进行挖掘分析处理,生成分析结果;所述日志神经网络综合处理单元包括:需求匹配检索模块,配置用于基于语义分析结果,使用预先建立的检索模型,在预先建立的日志网络中进行检索,得到日志检索集合;日志数据分析模块,配置用于基于日志检索集合,进行日志数据处理,再基于日志数据处理后的结果,进行日志数据分析,得到分析结果;可视化模块,配置用于显示分析结果。/n

【技术特征摘要】
1.基于语义分析的计算机流程分析挖掘系统,其特征在于,所述系统包括:需求语义分析单元,配置用于对用户的分析需求进行语义分析,得到需求语义分析结果;日志神经网络综合处理单元,配置用于根据语义分析结果,对计算机内的日志进行挖掘分析处理,生成分析结果;所述日志神经网络综合处理单元包括:需求匹配检索模块,配置用于基于语义分析结果,使用预先建立的检索模型,在预先建立的日志网络中进行检索,得到日志检索集合;日志数据分析模块,配置用于基于日志检索集合,进行日志数据处理,再基于日志数据处理后的结果,进行日志数据分析,得到分析结果;可视化模块,配置用于显示分析结果。


2.如权利要求1所述的系统,其特征在于,所述需求语义分析单元,包括:自然语义分析模块、图像语义分析模块和权重判断模块;所述自然语义分析模块,配置用于建立词语义库,生成分析需求对应的词语义向量,形成最终的语义检索向量,将语义检索向量在语义库中进行分析匹配识别,得到第一语义分析结果;所述图像语义分析模块,配置用于对需求分析进行图像语义识别,得到第二语义分析结果;所述权重判断模块,配置用于基于第一语义分析结果和第二语义分析结果,使用预设的权重判断公式,生成最终的语义分析结果;所述权重判断公式为:最终的语义分析结果=第一语义分析结果*A+第二语义分析结果*B;其中,A和B为权重值,A取值范围分别为:0.1~0.4;B取值范围为:0.6~0.9;且A+B=1。


3.如权利要求2所述的系统,其特征在于,所述自然语义分析模块,建立词语义库,生成分析需求对应的词语义向量,形成最终的语义检索向量,将语义检索向量在语义库中进行分析匹配识别,得到第一语义分析结果的方法执行以下步骤:建立词语义库,基于用户输入的分析需求构造各自的词语义向量,形成最终的语义检索向量,并将语义检索向量与语义库进行类别匹配查询,得到初始的分析结果;对初始分析结果进行优化排序,并将最终分析结果返回给用户;所述构造词语义库的方法包括:构造概念空间;设定空间为m维;概念空间的基础维度是一些类别标签的集合,能够表示整个语义库的信息,从语义库分类标签中直接提取的m个类别标签构成向量的m个维度,则分析需求中每个词的语义信息由一个m维向量来描述,称为词语义向量;词语义向量分量值的确定:词是从训练模型的网页分析需求中提取出来的,词语义向量的每一个分量值的大小由训练模型的所有分析需求来决定;词语义向量的每一个分量值计算公式为:

其中,ci代表词语义库中的第j个词,w(ci,tj)代表词ci与对应词语义向量中第i个维度tj的关系,即是词ci对应词语义向量的第i个分量值;|D|为训练分析需求的数量;tf(dk,tj)指的是词ci在分析需求dk中出现的频率;H(ci,dk)是个判断函数:如果分析需求dk属于维度tj所描述的领域,则H(ci,dk)值为1,否则为0;length(dk)为分析需求dk的长度,即分析需求dk经过分词去噪后得到的词的个数,当某一个词在分析需求中多次出现时,则重复计数,即length(dk)≥n是分析需求的数量;将词语义向量单位化处理,使其分量值范围为[0,1],多个单位化后的词语义向量便形成词语义库。


4.如权利要求3所述的系统,其特征在于,所述日志数据分析模块,基于日志检索集合,进行日志数据处理,的方法执行以下步骤:进行日志数据预处理,包括:去除唯一属性、处理缺失值和异常值检测及处理;进行日志数据规约处理,包括:去平均值、计算协方差矩阵、计算协方差矩阵的特征值与特征向量、对特征值从大到小排序、保留最大的特征向量、将日志数据转换到特征向量构建的新空间中;最后得处理后的新的日志数据,这些日志数据之间两两不相干,但保持原有的信息;进行日志数据标准化处理,将数据按比例缩放,使之落入设定的特定区间。


5.如权利要求4所述的系统,其特征在于,所述基于日志数据处理后的结果,进行日志数据分析,得到分析结果的方法执行以下步骤:基于日志数据处理后的结果,调用预设的分析算法模...

【专利技术属性】
技术研发人员:魏磊
申请(专利权)人:魏磊
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1