一种计算机硬件故障更换件推荐的方法技术

技术编号:32785266 阅读:13 留言:0更新日期:2022-03-23 19:44
本发明专利技术涉及一种基于集成学习和知识图谱的计算机硬件故障更换备件推荐方法,是基于集成学习和知识图谱的计算机硬件故障更换备件推荐方法,包括以下步骤:数据清洗;二次数据清洗;生成特征词组;将特征词组与计算机机型结合;使用计数向量化器词袋模型进行文本特征提取;将得到的词汇向量和标准故障放入随机森林模型中,进行训练,训练完成后保存模型;对客户的故障描述,由模型生成标准故障代码;将清洗后的工单数据中与标准故障代码、故障现象、更换备件、机型相关的信息进行分类,形成知识图谱;将随机森林生成的标准故障代码作为条件,按照标准故障代码节点和更换备件节点之间关系的权重值进行降序排列,计算机硬件故障更换备件推荐完成。备件推荐完成。备件推荐完成。

【技术实现步骤摘要】
一种计算机硬件故障更换件推荐的方法


[0001]本专利技术涉及一种计算机硬件故障更换件推荐的方法,利用人工智能领域集成学习结合知识图谱的技术,提取客户语言描述中的故障信息,准确找到故障代码,快速定位故障,及时检索出能解决故障所需的更换备件,也为后续相关备件的合理备货提供决策依据。

技术介绍

[0002]现有技术中的故障诊断方法大致可以划分为:基于解析模型的方法、基于信号处理的方法和基于知识的诊断方法。所述基于信号的处理方法,通常是利用信号模型,如相关函数、频谱、自回归滑动平均、小波变换等,直接分析可测信号,提取诸如方差、幅值、频率等特征,从而检测出故障。所谓基于解析模型的方法,是在明了诊断对象数学模型的基础上,按一定的数学方法对被测信息进行处理诊断,它可以分为状态估计法,等价空间法和参数估计法。目前这两种方法虽然得到了深入的研究,但在实际情况中,常常难以获得对象的精确数学模型,这就大大限制了这类诊断方法的使用范围和效果。随着人工智能技术的飞速发展,产生了基于知识的故障诊断方法,主要可分为:专家系统故障诊断法、模糊故障诊断法、故障树故障诊断法和神经网络故障诊断法,这些方法也存在一些局限性:专家系统由于应用依赖于专家的领域知识获取,存在“瓶颈”问题,而且自适应能力、学习能力以及及时性方面也都存在不同程度的局限性;模糊诊断中,特征元素选择不合理会导致诊断精度下降,构造隶属函数也因人为主观因素受影响;故障树诊断中,故障树建立不全面或者不正确,影响诊断方法;神经网络故障诊断虽然有其独特性,但忽视了客户对故障描述的语言中涵盖的语义信息,而且网络权值表达方式难以理解,可解释性对于工业界应用来说尤其重要,如果可解释性比较差,则很难及时把问题定位出来。

技术实现思路

[0003]本专利技术的目的是克服上述现有技术的不足,提出一种基于集成学习和知识图谱的计算机硬件故障更换备件推荐方法,是基于集成学习和知识图谱的计算机硬件故障更换备件推荐方法,包括以下步骤:
[0004]S1数据清洗;以增量的方式,不断获取计算机硬件维修历史工单,并对工单数据进行初步的数据清洗,对关键字段进行值校验,剔除空值、乱码、特殊符号等异常数据;
[0005]S2对工单中的客户故障描述去停用词,进行二次数据清洗;
[0006]S3对客户故障描述进行分词;使用Jieba库,确定客户故障描述中的每个字之间的关联概率,汉字间概率大的组成词组,形成分词结果,生成特征词组;
[0007]S4将特征词组与计算机机型结合,作为特征组,确保故障的特征以及客户描述的语义与计算机的机型建立相关性,为后续模型训练提供更明确的数据;
[0008]S5使用计数向量化器词袋模型进行文本特征提取;计数向量化器通过计数来将特征组转换为向量;当不存在先验字典时,计数向量化器作为估算器提取词汇进行训练,并生成一个计数向量模型,用于存储相应的词汇向量空间;
[0009]S6将S5得到的词汇向量作为X输入,将标准故障代码作为y标签,放入随机森林模型中,进行训练,训练完成后保存模型;
[0010]S7对客户的故障描述,使用S6生成的模型进行NLP自然语言处理,转为标准故障代码:维修客服中心在接到线上客户咨询时,系统根据客户的故障描述,调用训练完成的随机森林模型,将客户对计算机硬件故障的描述传入模型,由模型生成标准故障代码;
[0011]S8将清洗后的工单数据中与标准故障代码、故障现象、更换备件、机型相关的信息进行分类,各个分类对应知识图谱中不同类型的节点,节点之间关系的权重值等于各个节点所属的分类在维修工单中关系出现的频次累加值,将节点与关系信息通过neo4j

admin导入neo4j图数据库中,形成知识图谱;
[0012]S9将随机森林生成的标准故障代码作为条件,传入S8创建的知识图谱,即刻检索出该标准故障代码对应的所有关联的更换备件,按照标准故障代码节点和更换备件节点之间关系的权重值进行降序排列,返回以往该故障发生时,使用次数最多、更换概率最大的一个可更换的备件;如果检索结果有多个备件时,可同时多返回第二、第三个结果,作为备选结果,应对第一个最优结果备件缺货时可以依次使用第二、第三个结果来代替;计算机硬件故障更换备件推荐完成。
[0013]进一步的,所述S1步骤中,数据来源为计算机硬件维修历史工单,并且是以增量方式获取,不断丰富随机森林模型的训练数据样本和知识图谱的节点、关系数据源。
[0014]进一步的,所述S2步骤中,对客户的故障描述进行停用词过滤处理,如果故障描述中出现了停用词库中的词,则删除该词。
[0015]进一步的,所述S3步骤中,对客户故障描述使用Jieba库进行分词,生成特征词组。
[0016]进一步的,所述S4步骤中,将分词后的客户故障描述和计算机的机型相结合,作为特征组。
[0017]进一步的,所述S5步骤中,使用计数向量化器词袋模型对特征组进行文本特征提取,生成词汇向量。
[0018]进一步的,所述S6步骤中,选取随机森林模型,并且将S5步骤的词汇向量作为模型的X输入,将标准故障代码作为模型训练的y标签。
[0019]进一步的,所述S7步骤中,将客户对计算机硬件故障的描述传入模型,模型直接生成标准故障代码。
[0020]进一步的,所述S8步骤中,节点之间关系的权重值等于各个节点所属的分类在维修工单中关系出现的频次累加值。
[0021]进一步的,所述S9步骤中,知识图谱检索的结果按照标准故障代码节点和更换备件节点之间关系的权重值进行降序排列,返回第一个最优结果,若有多个结果,则多返回1至2个备用结果。
[0022]本专利技术选择集成学习中的随机森林模型,通过将以增量的方式不断丰富的计算机硬件维修历史工单作为训练样本,使得庞大的语料来源不断提高了随机森林分类的性能,以此来达到面对相同的故障类型,客户千变万化的语言描述也能高效地识别,并有效地转为标准故障代码。
[0023]本专利技术选择图数据库代替传统关系型数据库。相比传统的关系型数据库,知识图谱中图数据库具有存储和查询两方面的技术优势:
[0024]1.存储方面,图数据提供了灵活的设计模式。知识图谱中存储了多样、海量的数据。在关系型数据库中所有的数据库模式都需要提前定义,后续改动代价高昂。而图模型中,只需要重新增加模式定义,再局部调整图数据,便可完成在原有的数据源上增加标签或添加属性。
[0025]2.查询方面,图数据库提供了高效的关联查询。在用图数据库存储的知识图谱中,可以通过查询实体的边和其边上的标签(即联系)来快速地获取与其相联系的另一实体,省去了复杂的各种表格的关联操作,关系查询更加便捷,效率显著提高。
[0026]图数据库善于处理大量的、复杂的、互联的、多变的网状数据,其效率远远高于传统的关系型数据库。本专利技术基于图数据库的优势,将计算机硬件故障代码、故障描述、故障现象以及更换备件等,与计算机硬件故障相关的各类信息以及信息之间的关联关系创建成知识图谱,不仅能本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算机硬件故障更换件推荐的方法,是基于集成学习和知识图谱的计算机硬件故障更换备件推荐方法,其特征在于,包括以下步骤:S1数据清洗;以增量的方式,不断获取计算机硬件维修历史工单,并对工单数据进行初步的数据清洗,对关键字段进行值校验,剔除空值、乱码、特殊符号等异常数据;S2对工单中的客户故障描述去停用词,进行二次数据清洗;S3对客户故障描述进行分词;使用Jieba库,确定客户故障描述中的每个字之间的关联概率,汉字间概率大的组成词组,形成分词结果,生成特征词组;S4将特征词组与计算机机型结合,作为特征组,确保故障的特征以及客户描述的语义与计算机的机型建立相关性,为后续模型训练提供更明确的数据;S5使用计数向量化器词袋模型进行文本特征提取;计数向量化器通过计数来将特征组转换为向量;当不存在先验字典时,计数向量化器作为估算器提取词汇进行训练,并生成一个计数向量模型,用于存储相应的词汇向量空间;S6将S5得到的词汇向量作为X输入,将标准故障代码作为y标签,放入随机森林模型中,进行训练,训练完成后保存模型;S7对客户的故障描述,使用S6生成的模型进行NLP自然语言处理,转为标准故障代码:维修客服中心在接到线上客户咨询时,系统根据客户的故障描述,调用训练完成的随机森林模型,将客户对计算机硬件故障的描述传入模型,由模型生成标准故障代码;S8将清洗后的工单数据中与标准故障代码、故障现象、更换备件、机型相关的信息进行分类,各个分类对应知识图谱中不同类型的节点,节点之间关系的权重值等于各个节点所属的分类在维修工单中关系出现的频次累加值,将节点与关系信息通过neo4j

admin导入neo4j图数据库中,形成知识图谱;S9将随机森林生成的标准故障代码作为条件,传入S8创建的知识图谱,即刻检索出该标准故障代码对应的所有关联的更换备件,按照标准故障代码节点和更换备件节点之间关系的权重值进行降序排列,返回以往该故障发生时,使用次数最多、更换概率最大的一个可更换的备件;如果...

【专利技术属性】
技术研发人员:赵秋枫朱排亮张朋朋曹布阳林劲陈莉娜
申请(专利权)人:迈创企业管理服务股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1