System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 故障定位方法、装置、电子设备和计算机可读介质制造方法及图纸_技高网

故障定位方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号:40093396 阅读:5 留言:0更新日期:2024-01-23 16:33
本发明专利技术公开了故障定位方法、装置、电子设备和计算机可读介质,涉及大数据处理与挖掘技术领域。该方法的一具体实施方式包括:计算各个分词的第一概率值,基于各个分词的第一概率值对各个分词进行排序,得到各个文本对应的第一关键词;以及,基于各个文本对应的第一关键词对文本进行分类,从而得到各个第一文本簇及其对应的第一关键词;对各个文本进行聚类,从而得到各个第二文本簇;以及,计算各个第二文本簇中各个分词的第二概率值,基于各个分词的第二概率值对各个分词进行排序,得到各个第二文本簇对应的第二关键词;基于第一关键词和第二关键词构建故障模型。该实施方式能够解决人工维护成本高和故障定位不准确的技术问题。

【技术实现步骤摘要】

本专利技术涉及大数据处理与挖掘,尤其涉及一种故障定位方法、装置、电子设备和计算机可读介质


技术介绍

1、当前,随着虚拟化、云计算等新技术的广泛应用,企业数据中心内部it基础设施规模成倍增长,计算机硬件和软件的规模不断的扩大,相应的计算机故障也频繁发生,一线运维人员迫切的需要更加专业、更加强大的运维工具。在数据中心的日常运维工作中,一般是通过基础监控系统和应用监控系统,构建针对数据中心软硬件故障发现的机制。在这个过程中,各种软硬件发生异常时,指标项会超过预设的阈值,进而触发告警,通知运维专家进行排障。

2、在整个“故障发现-故障识别-故障处置”的全流程中,可以先设定故障模型,进行自动的故障判定,进而进行针对故障的自动处置,从而排除故障恢复系统安全。

3、在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:

4、故障模型的设定完全依赖运维专家经验的沉淀,人工维护成本高;而且,人工建立故障模型,对日益增长的软硬件故障,很难覆盖全面,导致故障定位不准确。


技术实现思路

1、有鉴于此,本专利技术实施例提供一种故障定位方法、装置、电子设备和计算机可读介质,以解决人工维护成本高和故障定位不准确的技术问题。

2、为实现上述目的,根据本专利技术实施例的一个方面,提供了一种故障定位方法,包括:

3、计算各个分词的第一概率值,基于所述各个分词的第一概率值对所述各个分词进行排序,得到各个文本对应的第一关键词;以及,基于所述各个文本对应的第一关键词对所述各个文本进行分类,从而得到各个第一文本簇及其对应的第一关键词;

4、对所述各个文本进行聚类,从而得到各个第二文本簇;以及,计算所述各个第二文本簇中各个分词的第二概率值,基于所述各个分词的第二概率值对所述各个分词进行排序,得到所述各个第二文本簇对应的第二关键词;

5、基于所述第一关键词和所述第二关键词构建故障模型;

6、实时接收告警信息,响应于所述告警信息命中所述故障模型,根据所述告警信息生成故障实例。

7、可选地,计算各个分词的第一概率值,基于所述各个分词的第一概率值对所述各个分词进行排序,得到各个文本对应的第一关键词,包括:

8、对于每个分词,分别计算所述分词在所述分词所在文本中的第一出现概率、所述分词在所有文本中的第二出现概率,将所述第一出现概率除以所述第二出现概率,得到所述分词的第一概率值;

9、基于所述各个分词的第一概率值对所述各个分词进行降序排列,从而筛选出排序靠前的n个分词作为所述文本对应的第一关键词。

10、可选地,基于所述各个文本对应的第一关键词对所述各个文本进行分类,从而得到各个第一文本簇及其对应的第一关键词,包括:

11、比对所述第一文本对应的第一文本关键词和所述第二文本对应的第一文本关键词,若所述第一文本关键词与所述第二文本关键词相同的数量大于等于m个,则将所述第一文本和所述第二文本划分到同一个文本簇中,从而得到第一文本簇及其对应的第一关键词;其中,n≥m。

12、可选地,对所述各个文本进行聚类,从而得到各个第二文本簇,包括:

13、对于每个文本,根据所述文本中各个分词的词向量,计算所述文本的文本向量;

14、采用夹角余弦公式计算所述文本向量与各个第二文本簇的簇心的距离;判断所述距离是否大于距离阈值;若是,则将所述文本划分到与所述文本的距离最小的第二文本簇中;若否,则新建一个第二文本簇,并将所述文本划分到新建的第二文本簇中。

15、可选地,计算所述各个第二文本簇中各个分词的第二概率值,基于所述各个分词的第二概率值对所述各个分词进行排序,得到所述各个第二文本簇对应的第二关键词,包括:

16、对于每个分词,分别计算所述分词在所述分词所在第二文本簇中的第三出现概率、所述分词在所有文本中的第二出现概率,将所述第三出现概率除以所述第二出现概率,得到所述分词的第二概率值;

17、基于所述各个分词的第二概率值对所述各个分词进行降序排列,从而筛选出排序靠前的t个分词作为所述第二文本簇对应的第二关键词。

18、可选地,基于所述第一关键词和所述第二关键词构建故障模型,包括:

19、对所述第一关键词和所述第二关键词进行合并和去重,从而得到模型关键词;

20、基于所述模型关键词构建关键词策略;

21、根据所述关键词策略、时间策略、空间策略和处置策略,构建故障模型。

22、可选地,对所述第一关键词和所述第二关键词进行合并和去重,从而得到模型关键词,包括:

23、比对所述第一关键词与所述第二关键词,若所述第一关键词与所述第二关键词相同的数量大于等于数量阈值,则将所述第一关键词和所述第二关键词合并,并对合并后的关键词进行去重,从而得到模型关键词。

24、另外,根据本专利技术实施例的另一个方面,提供了一种故障定位装置,包括:

25、第一提取模块,用于计算各个分词的第一概率值,基于所述各个分词的第一概率值对所述各个分词进行排序,得到各个文本对应的第一关键词;以及,基于所述各个文本对应的第一关键词对所述各个文本进行分类,从而得到各个第一文本簇及其对应的第一关键词;

26、第二提取模块,用于对所述各个文本进行聚类,从而得到各个第二文本簇;以及,计算所述各个第二文本簇中各个分词的第二概率值,基于所述各个分词的第二概率值对所述各个分词进行排序,得到所述各个第二文本簇对应的第二关键词;

27、构建模块,用于基于所述第一关键词和所述第二关键词构建故障模型;

28、定位模块,用于实时接收告警信息,响应于所述告警信息命中所述故障模型,根据所述告警信息生成故障实例。

29、可选地,所述第一提取模块还用于:

30、对于每个分词,分别计算所述分词在所述分词所在文本中的第一出现概率、所述分词在所有文本中的第二出现概率,将所述第一出现概率除以所述第二出现概率,得到所述分词的第一概率值;

31、基于所述各个分词的第一概率值对所述各个分词进行降序排列,从而筛选出排序靠前的n个分词作为所述文本对应的第一关键词。

32、可选地,所述第一提取模块还用于:

33、比对所述第一文本对应的第一文本关键词和所述第二文本对应的第一文本关键词,若所述第一文本关键词与所述第二文本关键词相同的数量大于等于m个,则将所述第一文本和所述第二文本划分到同一个文本簇中,从而得到第一文本簇及其对应的第一关键词;其中,n≥m。

34、可选地,所述第二提取模块还用于:

35、对于每个文本,根据所述文本中各个分词的词向量,计算所述文本的文本向量;

36、采用夹角余弦公式计算所述文本向量与各个第二文本簇的簇心的距离;判断所述距离是否大于距离阈值;若是,则将所述文本划分到与所述文本的距离最小的第二文本簇中;若否,则新建一个第二文本文档来自技高网...

【技术保护点】

1.一种故障定位方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,计算各个分词的第一概率值,基于所述各个分词的第一概率值对所述各个分词进行排序,得到各个文本对应的第一关键词,包括:

3.根据权利要求2所述的方法,其特征在于,基于所述各个文本对应的第一关键词对所述各个文本进行分类,从而得到各个第一文本簇及其对应的第一关键词,包括:

4.根据权利要求1所述的方法,其特征在于,对所述各个文本进行聚类,从而得到各个第二文本簇,包括:

5.根据权利要求1所述的方法,其特征在于,计算所述各个第二文本簇中各个分词的第二概率值,基于所述各个分词的第二概率值对所述各个分词进行排序,得到所述各个第二文本簇对应的第二关键词,包括:

6.根据权利要求1所述的方法,其特征在于,基于所述第一关键词和所述第二关键词构建故障模型,包括:

7.根据权利要求6所述的方法,其特征在于,对所述第一关键词和所述第二关键词进行合并和去重,从而得到模型关键词,包括:

8.一种故障定位装置,其特征在于,包括:

9.根据权利要求8所述的装置,其特征在于,所述第一提取模块还用于:

10.根据权利要求9所述的装置,其特征在于,所述第一提取模块还用于:

11.根据权利要求8所述的装置,其特征在于,所述第二提取模块还用于:

12.根据权利要求8所述的装置,其特征在于,所述第二提取模块还用于:

13.根据权利要求8所述的装置,其特征在于,所述构建模块还用于:

14.根据权利要求13所述的装置,其特征在于,所述构建模块还用于:

15.一种电子设备,其特征在于,包括:

16.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。

17.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法。

...

【技术特征摘要】

1.一种故障定位方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,计算各个分词的第一概率值,基于所述各个分词的第一概率值对所述各个分词进行排序,得到各个文本对应的第一关键词,包括:

3.根据权利要求2所述的方法,其特征在于,基于所述各个文本对应的第一关键词对所述各个文本进行分类,从而得到各个第一文本簇及其对应的第一关键词,包括:

4.根据权利要求1所述的方法,其特征在于,对所述各个文本进行聚类,从而得到各个第二文本簇,包括:

5.根据权利要求1所述的方法,其特征在于,计算所述各个第二文本簇中各个分词的第二概率值,基于所述各个分词的第二概率值对所述各个分词进行排序,得到所述各个第二文本簇对应的第二关键词,包括:

6.根据权利要求1所述的方法,其特征在于,基于所述第一关键词和所述第二关键词构建故障模型,包括:

7.根据权利要求6所述的方法,其特征在于,对所述第一关键词和所述第二关键词进行合并和去...

【专利技术属性】
技术研发人员:陈翟翟
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1