【技术实现步骤摘要】
使用自然语言处理的聚类
[0001]相关申请的交叉引用
[0002]本申请要求美国临时专利申请63/119,500的权益,该申请通过引用并入本文。
[0003]以下申请中的每一个都通过引用并入本文,就好像它们整体被陈述一样:2020年11月13日提交的美国申请第16/185,588号;2015年9月24日提交美国申请第14/863,994号;以及2014年9月26日提交的美国临时专利申请62/056,073。
[0004]本公开涉及用于处理日志文件的技术。具体而言,本公开涉及使用自然语言处理对日志文件进行聚类以提供对计算资源的行为的分析见解并触发下游自动化动作。
技术介绍
[0005]许多类型的计算系统和应用程序生成与该计算系统或应用程序的操作有关或由该计算系统或应用程序的操作造成的大量数据。这些大量数据存储在诸如日志记录之类的收集位置中,这些位置随后可被应用程序访问以查看其中包含的内容。例如,应用程序可能打开日志文件,该日志文件包含硬件或软件资源的各种性能指标。
[0006]服务器管理员和应 ...
【技术保护点】
【技术特征摘要】
1.一种方法,包括:接收对记录集合进行聚类的请求;响应于接收到对所述记录集合进行聚类的请求,识别与一个或多个令牌权重的集合或一个或多个规则的集合中的至少一个以及一个或多个令牌的集合相关联的至少一个字典;至少部分地基于与所述字典相关联的所述一个或多个令牌权重的集合或所述一个或多个规则的集合中的至少一个以及所述一个或多个令牌的集合来生成一个或多个集群的集合,其中所述一个或多个集群的集合中的每个集群表示与所述字典和组相关联的一个或多个令牌的独特子集,从所述记录集合,一个或多个记录的子集被映射到与所述字典相关联的一个或多个令牌的独特子集;和基于所述一个或多个集群的集合中的至少一个集群来执行至少一个动作。2.如权利要求1所述的方法,其中,至少部分地基于与对应令牌相关联的情绪来生成给定令牌的令牌权重,其中负面情绪使给予令牌的权重增加。3.如权利要求1所述的方法,其中,所述至少一个字典包括为特定域生成的特定于域的字典,其中,至少部分地由对应令牌在该特定域中的含义来确定与该对应令牌相关联的令牌权重。4.如权利要求1所述的方法,其中,所述至少一个字典包括为第一域生成的特定于第一域的字典和为第二域生成的特定于第二域的字典;其中,生成所述一个或多个集群的集合包括使用特定于第一域的字典来为与第一域相关联的日志记录生成第一集群集合以及使用特定于第二域的字典来为与第二域相关联的日志记录生成第二集群集合。5.如权利要求1所述的方法,其中,所述一个或多个集群的集合是使用第一字典生成的;其中,该方法还包括:使用第二字典来生成第二集群集合,该第二字典包括不在第一字典中的至少一个令牌,其中第二集群集合中的每个集群表示来自第二字典的令牌的独特组合;其中,第二集群集合中的至少一个集群基于不在第一字典中的至少一个令牌对记录进行分组。6.如权利要求1所述的方法,其中,生成所述一个或多个集群的集合包括:至少部分地基于与来自所述至少一个字典的令牌相关联的令牌权重,从所述至少一个字典中选择第一令牌子集;以及使用第一令牌子集对所述记录集合进行聚类;其中,尚未被选择的第二令牌子集不用于对所述记录集合进行聚类。7.如权利要求1所述的方法,还包括:经由交互式界面的第一层呈现所述一个或多个集群的集合;通过所述交互式界面接收对所述一个或多个集群的集合中的特定集群的选择;响应于该选择,经由交互式界面的第二层呈现与被映射到由所选择的集群表示的一个或多个令牌的子集的日志记录相关联的聚合信息。8.如权利要求1所述的方法,还包括:从用户接收将从日志记录中提取的至少一个令牌添加到所述至少一个字典的第二请求;响应于该请求,将该令牌添加到所述至少一个字典。9.如权利要求1所述的方法,还包括:将由所述一个或多个集群的集合中的特定集群表示的令牌的独特组合映射到至少一个描述性标签,该至少一个描述性标签描述由该特定集群表示的至少一个行为。10.如权利要求1所述的方法,其中,所述至少一个自动化动作包括以下各项中的至少一个:呈现推荐的补救措施以解决由特定日志记录集群表示的行为,将补丁应用到与该特
定日志记录集群相关联的一个或多个资源,或者调整与所述与该特定日志记录集群相关联的一个或多个资源相关联的一个或多个配置设置。11.如权利要求1所述的方法,其中,所述记录的子集中的至少一个记录不包括与由所述集群表示的一个或多个令牌的子集的精确匹配;其中,基于提取的关键字与令牌的独特组合中的至少一个关键字之间的相似性,将所述至少一个记录包括在所述记录的子集中。12.一种非暂时性计算机可读介质,其存储指令,这些指令当由一个或多个硬件处理器执行时导致:接收对记录集合进行聚类的请求;响应于接收到对所述记录集合进行聚类的请求,识别与一个或多个令牌权重的集合或一个或多个规则的集合中的至少一个以及一个或多个令牌的集合相关联的至少一个字典;至少部分地基于与所述字典相关联的所述一个或多个令牌权重的集合或所述一个或多个规则的集合中...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。