故障工单聚类方法及装置制造方法及图纸

技术编号:39394571 阅读:10 留言:0更新日期:2023-11-19 15:49
本申请涉及自然语言处理领域,提供一种故障工单聚类方法及装置

【技术实现步骤摘要】
故障工单聚类方法及装置


[0001]本申请涉及自然语言处理
,具体涉及一种故障工单聚类方法及装置


技术介绍

[0002]当前对系统故障工单的智能化处理手段比较少,但是智能化分析和处理系统故障工单的需求却是与日俱增

通过智能化分析和处理系统故障工单,能极大的减小运维人员工作量,提高工作效率;能快速找到相似系统故障的解决办法,解决客户问题;能找到系统故障频率比较高的问题,从而加以预防或者提前解决,避免资源浪费

[0003]现有的对于工单这样的文本数据进行聚类的算法大都是基于
TF

IDF(Term Frequency

Inverse Document Frequency
,词频

逆文本频率
)
算法和余弦相似度来直接进行计算的,这种算法将分词后的每个词语单独与故障工单的匹配,由于多个词语之间有不同的组合形式,每个组合形式下的故障表述可能完全不同,因此,仅用单个词语不能准确表述实际的故障情形,将单个词语与故障工单匹配,会造成故障工单聚类的准确率较低


技术实现思路

[0004]本申请实施例提供一种故障工单聚类方法及装置,用以解决将单个词语与故障工单匹配造成的故障工单聚类准确率较低的技术问题

[0005]第一方面,本申请实施例提供一种故障工单聚类方法,包括:
[0006]从目标系统至少一条故障工单的故障描述文本中获取
>N
个形容词,其中,
N
为大于等于1的整数;
[0007]排列组合所述目标系统的
M
个实体名称和所述
N
个形容词,得到
M*N
个关键词组,其中,
M
为大于等于1的整数;
[0008]根据单条故障工单中待处理词语的词向量,确定所述单条故障工单的故障工单向量;
[0009]将单条故障工单的故障描述文本与所述
M*N
个关键词组依次匹配,根据匹配成功情况得到待聚类关键词组;
[0010]将每条故障工单的所述待聚类关键词组的词向量聚类,得到
X
类关键词向量,其中,
X
为大于等于1的整数;
[0011]分别在所述
X
类的每类中将所述关键词向量与所述故障工单向量匹配,将匹配成功的所述故障工单向量聚类

[0012]在一个实施例中,所述从目标系统至少一条故障工单的故障描述文本中获取
N
个形容词,包括:
[0013]分词处理所述故障描述文本,得到多个词语,分别标注所述多个词语的词性,获取所述多个词语中的
N
个形容词

[0014]在一个实施例中,所述根据单条故障工单中待处理词语的词向量,确定所述单条故障工单的故障工单向量之前,包括:
[0015]利用词频

逆文本频率
TF

IDF
算法对单条故障工单中分词处理后的每个词语加权,根据所述每个词语的权重,在所述单条故障工单中随机丢弃
Y
个词语,将剩下的词语作为所述单条故障工单中的待处理词语,其中,
Y
为大于等于1的整数

[0016]在一个实施例中,所述根据单条故障工单中待处理词语的词向量,确定所述单条故障工单的故障工单向量,包括:
[0017]向量化单条故障工单中的待处理词语,得到所述单条故障工单中待处理词语的词向量,计算所述单条故障工单中待处理词语的词向量的平均值,得到所述单条故障工单的故障工单向量

[0018]在一个实施例中,所述将单条故障工单的故障描述文本与所述
M*N
个关键词组依次匹配,根据匹配成功情况得到待聚类关键词组,包括:
[0019]将单条故障工单的故障描述文本与所述
M*N
个关键词组依次匹配,若匹配成功的关键词组的数量为1个,则将所述匹配成功的关键词组作为待聚类关键词组;若匹配成功的关键词组的数量大于1个,则将第一个匹配成功的关键词组作为待聚类关键词组

[0020]在一个实施例中,所述将每条故障工单的所述待聚类关键词组的词向量聚类,得到
X
类关键词向量,包括:
[0021]向量化每条故障工单的所述待聚类关键词组,得到待聚类关键词向量,采用并行方式将所述待聚类关键词向量聚类,得到
X
类关键词向量

[0022]在一个实施例中,所述排列组合所述目标系统的
M
个实体名称和所述
N
个形容词,包括:
[0023]按照所述
M
个实体名称和所述
N
个形容词获取时间的先后顺序排列组合所述
M
个实体名称和所述
N
个形容词

[0024]在一个实施例中,所述将单条故障工单的故障描述文本与所述
M*N
个关键词组依次匹配之后,包括:
[0025]若匹配成功的关键词组的数量为0个,则将所述故障工单单独作为一类

[0026]第二方面,本申请实施例提供一种故障工单聚类装置,包括:
[0027]形容词获取模块,用于从目标系统至少一条故障工单的故障描述文本中获取
N
个形容词,其中,
N
为大于等于1的整数;
[0028]关键词组获取模块,用于排列组合所述目标系统的
M
个实体名称和所述
N
个形容词,得到
M*N
个关键词组,其中,
M
为大于等于1的整数;
[0029]故障工单向量获取模块,用于根据单条故障工单中待处理词语的词向量,确定所述单条故障工单的故障工单向量;
[0030]关键词组匹配模块:用于将单条故障工单的故障描述文本与所述
M*N
个关键词组依次匹配,根据匹配成功情况得到待聚类关键词组;
[0031]关键词组聚类模块,用于将每条故障工单的所述待聚类关键词组的词向量聚类,得到
X
类关键词向量,其中,
X
为大于等于1的整数;
[0032]故障工单聚类模块,用于分别在所述
X
类的每类中将所述关键词向量与所述故障工单向量匹配,将匹配成功的所述故障工单向量聚类

[0033]第三方面,本申请实施例提供一种电子设备,包括处理器和存储有计算机程序的存储器,所述处理器执行所述程序时实现第一方面所述的故障工单聚类方法的步骤

[0034]第四方面,本申请实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现第一方面所述的故障本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种故障工单聚类方法,其特征在于,包括:从目标系统至少一条故障工单的故障描述文本中获取
N
个形容词,其中,
N
为大于等于1的整数;排列组合所述目标系统的
M
个实体名称和所述
N
个形容词,得到
M*N
个关键词组,其中,
M
为大于等于1的整数;根据单条故障工单中待处理词语的词向量,确定所述单条故障工单的故障工单向量;将单条故障工单的故障描述文本与所述
M*N
个关键词组依次匹配,根据匹配成功情况得到待聚类关键词组;将每条故障工单的所述待聚类关键词组的词向量聚类,得到
X
类关键词向量,其中,
X
为大于等于1的整数;分别在所述
X
类的每类中将所述关键词向量与所述故障工单向量匹配,将匹配成功的所述故障工单向量聚类
。2.
根据权利要求1所述的故障工单聚类方法,其特征在于,所述从目标系统至少一条故障工单的故障描述文本中获取
N
个形容词,包括:分词处理所述故障描述文本,得到多个词语,分别标注所述多个词语的词性,获取所述多个词语中的
N
个形容词
。3.
根据权利要求2所述的故障工单聚类方法,其特征在于,所述根据单条故障工单中待处理词语的词向量,确定所述单条故障工单的故障工单向量之前,包括:利用词频

逆文本频率
TF

IDF
算法对单条故障工单中分词处理后的每个词语加权,根据所述每个词语的权重,在所述单条故障工单中随机丢弃
Y
个词语,将剩下的词语作为所述单条故障工单中的待处理词语,其中,
Y
为大于等于1的整数
。4.
根据权利要求1所述的故障工单聚类方法,其特征在于,所述根据单条故障工单中待处理词语的词向量,确定所述单条故障工单的故障工单向量,包括:向量化单条故障工单中的待处理词语,得到所述单条故障工单中待处理词语的词向量,计算所述单条故障工单中待处理词语的词向量的平均值,得到所述单条故障工单的故障工单向量
。5.
根据权利要求1所述的故障工单聚类方法,其特征在于,所述将单条故障工单的故障描述文本与所述
M*N
个关键词组依次匹配,根据匹配成功情况得到待聚类关键词组,包括:将单条故障工单的故障描述文本与所述
M*N
个关键词组依次匹配,若匹配成功的关键词组的数量为1个,则将所述匹配成功的关键词组作为待聚类关键词组;若匹配成功的关键词组的数量大于1个...

【专利技术属性】
技术研发人员:孙一凯
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1