数据分析装置、数据分析系统和程序制造方法及图纸

技术编号:39039960 阅读:15 留言:0更新日期:2023-10-10 11:52
数据分析装置(2)具有:字符串分类部(211)和数值分类部(212),它们取得分别具有能够在序列内和序列间进行元素的顺序关系比较的索引的、将与作为分析对象的信息系统有关的字符串设为元素的序列数据和将表示构成信息系统的设备的状态的数值设为元素的序列数据,按照取得的每个序列数据将元素分类到分类类别,输出将表示分类类别的分类值设为元素的序列数据;序列统合部(213),其把将字符串的分类值设为元素的序列数据和将数值的分类值设为元素的序列数据统一成一个序列数据;以及频繁模式检测部(215),其使用序列统合部(213)统一成一个的序列数据,检测频繁的元素的组合即频繁模式的发生。式的发生。式的发生。

【技术实现步骤摘要】
【国外来华专利技术】数据分析装置、数据分析系统和程序


[0001]本专利技术涉及数据分析装置、数据分析系统和程序。

技术介绍

[0002]已提出如下技术:对从构成信息系统的设备输出的字符串的日志数据应用频繁模式挖掘,由此对信息系统中发生的现象进行分析。例如,在非专利文献1中记载有如下的现有技术:针对对字符串的日志数据中的各行数据进行分类而得到的结果实施频繁模式挖掘,由此对作为分析对象的信息系统中发生的现象进行分析。
[0003]现有技术文献
[0004]非专利文献
[0005]非专利文献1:F.Lin,K.Muzumdar,N.P.Laptev,M.

V.Curelea,S.Lee,and S.Sankar,“Fast dimensional analysis for root cause investigation in a large

scale service environment,”in Proceedings of the ACM on Measurement and Analysis of Computing Systems(POMACS),2020.

技术实现思路

[0006]专利技术要解决的课题
[0007]但是,非专利文献1记载的现有技术存在以下这种课题:在进行频繁模式挖掘的日志数据是分析所需要的信息不足的数据的情况下,作为分析对象的信息系统中发生的现象的分析精度降低。
[0008]本专利技术解决上述课题,其目的在于,得到能够对信息系统中发生的现象的分析所需要的数据进行补充的数据分析装置、数据分析系统和程序。
[0009]用于解决课题的手段
[0010]本专利技术的数据分析装置具有:分类部,其取得分别具有能够在序列内和序列间进行元素的顺序关系比较的索引的、将与作为分析对象的信息系统有关的字符串设为元素的序列数据和将表示构成信息系统的设备的状态的数值设为元素的序列数据,按照取得的每个序列数据将元素分类到分类类别,输出将表示分类类别的分类值设为元素的序列数据;统合部,其把将字符串的分类值设为元素的序列数据和将数值的分类值设为元素的序列数据统一成一个序列数据;以及检测部,其使用由统合部统一成一个的序列数据,检测频繁的元素的组合即频繁模式的发生。
[0011]专利技术效果
[0012]根据本专利技术,把将与作为分析对象的信息系统有关的字符串设为元素的序列数据、以及将表示构成信息系统的设备的状态的数值设为元素的序列数据统一成一个序列数据,由此,能够对一个序列数据用另一个序列数据进行补充而得到的序列数据实施频繁模式挖掘。由此,本专利技术的数据分析装置能够对信息系统中发生的现象的分析所需要的数据进行补充。
附图说明
[0013][图1]是示出实施方式1的数据分析系统的结构的框图。
[0014][图2]图2A是示出将字符串设为元素的时序数据的例子的图,图2B是示出将数值设为元素的时序数据的例子的曲线图,图2C是示出对时序数据中不包含的时间戳中的元素进行插值而得到的时序数据的例子的曲线图。
[0015][图3]是示出实施方式1的数据分析装置的动作的流程图。
[0016][图4]是示出频繁模式分析部的结构的框图。
[0017][图5]是示出频繁模式分析部的学习时的动作的流程图。
[0018][图6]图6A是示出将字符串设为元素的时序数据的例子的图,图6B是示出将数值设为元素的时序数据的例子的曲线图,图6C是示出将字符串的分类值设为元素的时序数据的例子的图,图6D是示出将数值的分类值设为元素的时序数据的例子的图。
[0019][图7]是示出频繁模式的提取处理的概要的图。
[0020][图8]是示出实施方式1的数据分析方法的流程图。
[0021][图9]是示出频繁模式的检测处理的概要的图。
[0022][图10]是示出插值处理部的结构的框图。
[0023][图11]是示出时序数据的插值处理的流程图。
[0024][图12]图12A是示出将字符串设为元素的时序数据的例子的图,图12B是示出将数值设为元素的时序数据的例子的曲线图,图12C是示出被插值后的时序数据的例子的曲线图。
[0025][图13]是示出检索处理部的结构的框图。
[0026][图14]是示出过去的作业信息的检索处理的流程图。
[0027][图15]图15A是示出存储装置中存储的频繁模式信息的图,图15B是示出过去的作业信息的例子的图。
[0028][图16]图16A是示出实现实施方式1的数据分析装置的功能的硬件结构的框图,图16B是示出执行实现实施方式1的数据分析装置的功能的软件的硬件结构的框图。
具体实施方式
[0029]实施方式1
[0030]图1是示出实施方式1的数据分析系统1的结构的框图。在图1中,数据分析系统1是进行作为分析对象的信息系统中发生的现象的分析的系统。信息系统是处理各种信息的系统,例如构成为包含进行与信息交换相关的动作的设备。此外,关于信息系统,例如存在实现数据库、数据仓库、数据统合服务、分散型应用或网络服务的计算机系统。
[0031]数据分析系统1具有数据分析装置2、输入装置3A、输入装置3B和存储装置4。数据分析装置2取得与作为分析对象的信息系统相关的时序数据,使用取得的时序数据进行数据分析。
[0032]输入装置3A受理将与作为分析对象的信息系统有关的字符串设为元素的时序数据的输入,将受理的字符串的时序数据输出到数据分析装置2。输入装置3B受理将表示构成信息系统的设备的状态的数值设为元素的时序数据的输入,将受理的数值的时序数据输出到数据分析装置2。
[0033]此外,从作为分析对象的信息系统取得的将字符串设为元素的时序数据和将数值设为元素的时序数据分别具有能够在序列内和序列间进行元素的顺序关系比较的索引即时间戳。
[0034]存储装置4存储有频繁模式的定义信息。定义信息所示的频繁模式可以是在从作为分析对象的信息系统取得的时序数据中由数据分析装置2提取出的频繁模式,也可以是由用户设定或修正后的同样形式的数据。进而,在存储装置4中对应地存储有针对信息系统中发生的现象的过去的作业信息和频繁模式。
[0035]图2A是示出将字符串设为元素的时序数据的例子的图。在由频繁模式分析部21取得的字符串的时序数据中设定有能够在时序内或时序数据间进行字符串的顺序关系比较的时间戳。例如,在图2A所示的时序数据中对应有“Oct 10 0:00:00”这样的时间戳和“received xxx”这样的字符串。时间戳能够对图2A所示的时序内的项目的顺序关系进行比较,还能够进行时序数据间的元素的顺序关系比较。
[0036]图2B是示出将数值设为元素的时序数据的例子的曲线图。例如如图2B所示,频繁模式分析部21取得的数值的时序数据(1)能够利用示出表示构成作为分析对象的信息系统的设备的状态的数值与时间之间的关系本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种数据分析装置,其特征在于,所述数据分析装置具有:分类部,其取得分别具有能够在序列内和序列间进行元素的顺序关系比较的索引的、将与作为分析对象的信息系统有关的字符串设为元素的序列数据和将表示构成该信息系统的设备的状态的数值设为元素的序列数据,按照取得的每个序列数据将元素分类到分类类别,输出将表示所述分类类别的分类值设为元素的序列数据;统合部,其把将所述字符串的分类值设为元素的序列数据和将所述数值的分类值设为元素的序列数据统一成一个序列数据;以及检测部,其使用由所述统合部统一成一个的序列数据,检测频繁的元素的组合即频繁模式的发生。2.根据权利要求1所述的数据分析装置,其特征在于,所述数据分析装置具有提取部,该提取部生成对由所述统合部统一成一个的序列数据中包含的元素的集合赋予了所述索引的识别值的事务数据,对所述事务数据实施频繁模式挖掘,由此提取频繁模式,所述检测部检测由所述提取部提取出的频繁模式的发生。3.根据权利要求2所述的数据分析装置,其特征在于,所述检测部根据所述事务数据中的元素的集合中是否存在与由所述提取部提取出的频繁模式一致的集合,检测频繁模式的发生。4.根据权利要求1~3中的任意一项所述的数据分析装置,其特征在于,所述数据分析装置具有插值处理部,该插值处理部根据将由所述检测部检测到的频繁模式设为元素的序列数据,计算频繁模式的发生率的估计值和频繁模式的发生率的统计量,使用计算出的频繁模式的发生率的估计值和频繁模式的发生率的统计量对序列数据中不包含的所述索引中的元素进行插值。5.根据权利要求1~4中的任意一项所述的数据分析装置,其特征在于,所述数据分析装置具有检索处理部,该检索处理部根据重要度,从将由所述检测部检测到的频繁模式设为元素的序列数据、将所述字符串设为元素的序列数据和将所述数值设为元素的序列数据中的至少一方选择序列数据,检索针对所述信息系统中发生的现象的过去的作业信息中的、与选择出的序列数据对应的作业信息,输出检索到的作业信息。6.根据权利要求4所述的数据分析装置,其特征在于,所述插值处理部具有:发生率计算部,其取得将由所述检测部检测到的频繁模式设为元素的序列数据,计算频繁模...

【专利技术属性】
技术研发人员:三塚由浩宫田好邦阿波基文酒井亮佑
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1