使用分类属性的数据挖掘制造技术

技术编号:19247240 阅读:32 留言:0更新日期:2018-10-24 08:59
本文中公开的实施例涉及确定所访问或所接收的数据中相关属性的模式。访问或接收与对与数据相对应的信息进行描述的属性相关联的数据。将数据分组为包括具有匹配的属性组合的数据的一个或多个子集。针对每个子集,迭代地移除与子集相关联的属性组合的属性,从而增加每个子集中所包括的数据量。在迭代地移除属性之后,对每个子集进行评分以确定与属性组合相关的一个或多个模式。

【技术实现步骤摘要】
【国外来华专利技术】使用分类属性的数据挖掘
技术介绍
随着软件应用从内部部署到基于云的解决方案的日益过渡,遥测数据比以往更多地被收集,并且应用性能管理(APM)正在成为软件应用成功越来越重要的部分。随着APM的增加,对日志分析的需求也越来越大,特别是对故障的分析。有效挖掘故障日志的能力可以加速和改进分析过程,从而改善整体软件质量并且降低成本。本文中要求保护的主题不限于解决任何缺点或仅在诸如上述那些环境中操作的实施例。而是,提供本“
技术介绍
”仅用于说明可以实践本文中描述的一些实施例的一个示例性

技术实现思路
提供本“
技术实现思路
”是为了以简化的形式介绍一些概念,这些概念将在下面的“具体实施方式”中进一步描述。本“
技术实现思路
”不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。本文中公开的实施例涉及用于确定故障数据中指示计算操作故障的根本原因的相关属性的模式的系统、方法和计算机可读介质。在一个实施例中,一种系统包括处理器和系统存储器。该系统在系统存储器中实例化聚合模块,聚合模块将所访问的数据(可以是故障数据)分组为子集。数据与对与所访问数据相关的信息进行描述的属性相本文档来自技高网...

【技术保护点】
1.一种计算系统,包括:至少一个处理器;以及系统存储器,所述系统存储器具有存储于其上的计算机可执行指令,所述计算机可执行指令在由所述至少一个处理器执行时使得以下各项在所述系统存储器中被实例化:聚合模块,所述聚合模块被配置为将所访问的数据分组为一个或多个子集,所述数据与一个或多个属性相关联,所述一个或多个属性描述与所述数据相关的信息,所述一个或多个子集包括具有所述一个或多个属性的匹配组合的数据;扩展模块,所述扩展模块被配置为针对所述一个或多个子集中的每个子集迭代地移除与所述子集相关联的属性组合中的一个或多个所述属性,从而增加所述子集中的每个子集中所包括的数据量;以及得分模块,所述得分模块被配置为...

【技术特征摘要】
【国外来华专利技术】2016.02.12 US 62/294,596;2016.06.15 US 15/183,3391.一种计算系统,包括:至少一个处理器;以及系统存储器,所述系统存储器具有存储于其上的计算机可执行指令,所述计算机可执行指令在由所述至少一个处理器执行时使得以下各项在所述系统存储器中被实例化:聚合模块,所述聚合模块被配置为将所访问的数据分组为一个或多个子集,所述数据与一个或多个属性相关联,所述一个或多个属性描述与所述数据相关的信息,所述一个或多个子集包括具有所述一个或多个属性的匹配组合的数据;扩展模块,所述扩展模块被配置为针对所述一个或多个子集中的每个子集迭代地移除与所述子集相关联的属性组合中的一个或多个所述属性,从而增加所述子集中的每个子集中所包括的数据量;以及得分模块,所述得分模块被配置为在迭代地移除所述一个或多个属性之后对每个子集进行评分,以确定与所述属性组合相关的一个或多个模式。2.根据权利要求1所述的系统,其中所述数据是指示计算操作的故障的故障数据,并且其中所述一个或多个模式指示最有可能导致计算操作的故障的所述属性组合。3.根据权利要求1所述的系统,其中所执行的所述计算机可执行指令在所述系统存储器中进一步实例化:选择模块,所述选择模块被配置为:选择具有最大数据量的所述一个或多个子集。4.根据权利要求1所述的计算系统,其中所述一个或多个属性是分类属性。5.根据权利要求1所述的系统,其中所执行的所述计算机可执行指令在所述系统存储器中进一步实例化:过滤模块,所述过滤模块被配置为:在由所述聚合模块对所述数据进行分组之前,从所述f数据中过滤掉非分类属性。6.根据权利要求1所述的系统,其中所执行的所述计算机可执行指令在所述系统存储器中进一步实例化:后过滤模块,所述后过滤模块被配置为:过滤掉覆盖具有相似得分的交叠子集的一个或多个模式。7.根据权利要求1所述的系统,其中所执行的所述计算机可执行指令在所述系统存储器中进一步实例化:输出模块,所述输出模块被配置为:向终端用户提供所述一个或多个模式。8.根据权利要求1所述的系统,其中所接收的所述数据被组织成表格,所述表格包括与所述数据相对应的行和与所述一个或多个属性相对应的列。9.根据权利要求1所述的系统,其中所述数据是指示计算操作的一个或多个故障的故障数据,所述故障数据包括在代码执行期间抛出的一个或多个异常、应用崩溃、失效的服务器请求或数据延迟。10.根据权利要求1所述的系统,其中所述属性包括以下中的一项或多项:地理数据、应用版本数据、错误代码、操作系统版本数据和...

【专利技术属性】
技术研发人员:R·B·奥弗A·埃尔达Y·S·瑞舍夫
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1