一种基于产品售后故障文本挖掘的故障分析方法及系统技术方案

技术编号:37541002 阅读:18 留言:0更新日期:2023-05-12 16:09
本发明专利技术公开了一种基于产品售后故障文本挖掘的故障分析方法及系统,该方法包括以下步骤:S1.采集结构化故障文本的新样本;S2.将新样本输入多维度故障文本相似分析模型,获取知识库中的标准样本,将新样本与标准样本进行相似度分析输出最匹配的标准样本,根据最匹配的标准样本获得失效知识链条;该系统包括结构化故障文本采集模块和多维度故障文本相似分析模型;本发明专利技术建立了产品售后历史样本、标准样本和新样本的关联关系,实现快速故障分析。实现快速故障分析。实现快速故障分析。

【技术实现步骤摘要】
一种基于产品售后故障文本挖掘的故障分析方法及系统


[0001]本专利技术涉及可靠性分析
,更具体的说是涉及一种基于产品售后故障文本挖掘的故障分析方法及系统。

技术介绍

[0002]以可靠性为中心的维修管理(Reliability Centered Maintenance——RCM),属于第三代维修管理的最具有代表性的模式,是综合了故障后果和故障模式的有关信息,以运行经济性为出发点的维修管理模式。
[0003]一般来说,RCM分析所需要的信息或数据包括产品概况、产品的故障信息、产品的维修保障信息和费用信息等,其中最重要的就是产品的故障记录,企业在产品售后故障文本的收集过程中已经累积了大量的失效知识库,称之为历史样本,这些历史样本包含了大量的有效经验,利用这些经验可以提炼出标准化的失效知识链条,称为标准样本;而新样本(已知故障模式和环境条件、工作状态等,但未得到与之相匹配的故障件、故障原因和维修建议等信息)仍需要经过故障分析才能形成完整的失效知识,从而沉淀为历史样本。基于大量的故障分析过程和结果具有很强的相似性和关联性,历史样本对新样本的分析具有重要的参考价值。
[0004]但是,对于故障文本的历史样本,目前存在的问题是文本记录不够标准化,缺失故障信息要素等,导致历史样本中难以提取出有效的失效知识链条形成标准样本;对于故障文本的新样本,很难从历史样本中快速定位和匹配有价值的失效知识,只能通过经验和主观分别分析,造成故障分析效率低下。
[0005]因此,如何提供一种基于产品售后故障文本挖掘的故障分析方法及系统是本领域技术人员亟需解决的问题。

技术实现思路

[0006]有鉴于此,本专利技术提供了一种基于产品售后故障文本挖掘的故障分析方法及系统,借助故障文本的历史样本和产品FMEA分析,形成了产品故障文本的标准样本,通过多维度故障文本的相似分析模型,得到新样本与最相似标准样本信息的匹配,实现快速故障分析。
[0007]为了实现上述目的,本专利技术采用如下技术方案:
[0008]一种基于产品售后故障文本挖掘的故障分析方法,包括以下步骤:
[0009]S1.采集结构化故障文本的新样本;
[0010]S2.将新样本输入多维度故障文本相似分析模型,获取知识库中的标准样本,将新样本与标准样本进行相似度分析输出最匹配的标准样本,根据最匹配的标准样本获得失效知识链条。
[0011]优选的,S2中标准样本的获得过程为:采集结构化故障文本的历史样本,对历史样本进行预处理后进行FMEA分析;
[0012]预处理的具体内容包括:
[0013](1)将历史样本按产品名称切分并编号,存入知识库;
[0014](2)剔除历史样本中的异常数据并进行标准化,按产品名称生成预处理数据并编号存入知识库;
[0015](3)合成不同产品的历史样本数据。
[0016]优选的,FMEA分析的具体内容包括:
[0017](1)根据不同产品的历史样本数据建立不同产品名称下的结构化FMEA表;
[0018](2)依次按照产品中出现的结构件,统计历史样本中失效模式出现的次数并进行发生度评分,并对FMEA表中的失效链条进行风险排序,得到标准样本存入知识库。
[0019]优选的,多维度故障文本相似分析模型的具体内容包括:
[0020](1)对标准样本和新样本分别进行中文分词处理;
[0021](2)将分词的新样本依次与分词的标准样本进行总体相似度计算;
[0022](3)总体相似度最高的为最匹配的标准样本。
[0023]优选的,总体样本相似度计算方法为:
[0024][0025]其中,L
j
为每个标准样本对应的总体相似度,L
ij
为每个维度的相似度,i=1,2,

,n,j=1,2,

,m,m为FMEA中的失效链条个数;
[0026]最高总体相似度为:
[0027]L
max
=max{L
j
}。
[0028]优选的,每个维度的相似度的计算具体为:
[0029]将标准样本和新样本的分词进行TF

IDF算法向量化,两个向量的夹角余弦相似度为:
[0030][0031]余弦夹角越小相似度越高。
[0032]优选的,通过欧式距离或SimHash算法计算每个维度的相似度。
[0033]一种基于产品售后故障文本挖掘的故障分析系统,包括结构化故障文本采集模块和多维度故障文本相似分析模型;
[0034]结构化故障文本采集模块,用于采集结构化故障文本的新样本并输入多维度故障文本相似分析模型;
[0035]多维度故障文本相似分析模型,用于获取知识库中的标准样本,将新样本与标准样本进行相似度分析输出最匹配的标准样本,根据最匹配的标准样本获得失效知识链条。
[0036]优选的,一种基于产品售后故障文本挖掘的故障分析系统,还包括历史样本处理模块;
[0037]结构化故障文本采集模块,还用于采集结构化故障文本的历史样本;
[0038]历史样本处理模块,用于对历史样本进行预处理后进行FMEA分析得到标准样本并存入知识库;
[0039]历史样本处理模块包括预处理单元和FMEA分析单元。
[0040]优选的,多维度故障文本相似分析模型包括分词单元、相似度计算单元和最匹配标准样本输出单元。
[0041]经由上述的技术方案可知,与现有技术相比,本专利技术公开提供了一种基于产品售后故障文本挖掘的故障分析方法及系统,通过对故障文本的历史样本进行文本挖掘,基于产品FMEA分析结果,对结构化的历史文本数据进行筛选和优化,由历史样本形成标准样本;建立多维度的故障文本相似度分析模型,将新样本作为输入,经过模型逼近和匹配标准样本,直接输出最可能的失效知识链条,从而建立产品售后历史样本、标准样本和新样本的关联关系,实现快速故障分析。
附图说明
[0042]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0043]图1附图为本专利技术提供的故障分析方法示意图;
[0044]图2附图为本专利技术提供的故障文本历史样本的数据预处理流程示意图;
[0045]图3附图为本专利技术提供的向量夹角示意图;
[0046]图4附图为本专利技术实施例提供的某型号BOF钢车的标准样本;
[0047]图5附图为本专利技术实施例提供的某型号BOF钢车的新样本。
具体实施方式
[0048]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于产品售后故障文本挖掘的故障分析方法,其特征在于,包括以下步骤:S1.采集结构化故障文本的新样本;S2.将新样本输入多维度故障文本相似分析模型,获取知识库中的标准样本,将新样本与标准样本进行相似度分析输出最匹配的标准样本,根据最匹配的标准样本获得失效知识链条。2.根据权利要求1所述的一种基于产品售后故障文本挖掘的故障分析方法,其特征在于,S2中标准样本的获得过程为:采集结构化故障文本的历史样本,对历史样本进行预处理后进行FMEA分析得到标准样本并存入知识库;预处理的具体内容包括:(1)将历史样本按产品名称切分并编号,存入知识库;(2)剔除历史样本中的异常数据并进行标准化,按产品名称生成预处理数据并编号存入知识库;(3)合成不同产品的历史样本数据。3.根据权利要求2所述的一种基于产品售后故障文本挖掘的故障分析方法,其特征在于,FMEA分析的具体内容包括:(1)根据不同产品的历史样本数据建立不同产品名称下的结构化FMEA表;(2)依次按照产品中出现的结构件,统计历史样本中失效模式出现的次数并进行发生度评分,并对FMEA表中的失效链条进行风险排序,得到标准样本存入知识库。4.根据权利要求1所述的一种基于产品售后故障文本挖掘的故障分析方法,其特征在于,多维度故障文本相似分析模型的具体内容包括:(1)对标准样本和新样本分别进行中文分词处理;(2)将分词的新样本依次与分词的标准样本进行总体相似度计算;(3)总体相似度最高的为最匹配的标准样本。5.根据权利要求4所述的一种基于产品售后故障文本挖掘的故障分析方法,其特征在于,总体样本相似度计算方法为:其中,L
j
为每个标准样本对应的总体相似度,L
ij
为每个维...

【专利技术属性】
技术研发人员:孙权冯静
申请(专利权)人:湖南银杏可靠性技术研究所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1