System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及故障案例管理,具体涉及一种基于关键词图谱的故障案例管理方法、系统、设备及介质。
技术介绍
1、故障案例是实际工程中故障分析知识的重要来源。故障案例一般由历史维修经验增量式归纳而成,涵盖设备已发生故障的故障表征、维修预案、发生频次等信息,从而辅助维修人员在维修阶段能够结合故障案例中的历史故障信息,实现对于即时故障的有效分析。
2、然而,在实际故障案例使用过程中,由于实际工程中庞大的案例规模与复杂的故障类型,现有的故障案例检索方法存在一定的缺陷。一方面,故障描述用词丰富,用户在传统关键词检索模式下,难以直接凭经验印象确定足以描述的关键词;另一方面,故障案例数量繁多,用户在复杂文本匹配模式下,难以高效实现对于模糊故障的即时诊断。
3、可见,现有技术中,故障案例在实际工程应用中关键词刻画困难、案例检索方法低效。
技术实现思路
1、有鉴于此,本专利技术提供了一种基于关键词图谱的故障案例管理方法、系统、设备及介质,能够实现面向实际多类型故障的故障案例管理方法,适用于多类型控制律逻辑的规范化评估。
2、为实现上述目的,本专利技术技术方案如下:
3、一种基于关键词图谱的故障案例管理方法,涉及故障案例载入阶段和故障案例查询阶段;
4、所述故障案例载入阶段,负责在用户载入的新故障案例条目后挖掘关键词,并建立更新新出现的关键词与已有关键词之间的关系;所述故障案例载入包括文本关键词挖掘和文本关键词建谱,其中,通过词频-逆文本频率指数
5、所述故障案例查询阶段,负责在用户为检索故障案例条目推荐关键词,并通过关键词组合检索匹配的故障案例条目;所述故障案例查询包括文本关键词衡量和文本关键词匹配,其中,通过关键词图谱根据用户已输入关键词组合推荐关键词实现文本关键词衡量;通过用户定义的关键词组合来排序并筛选匹配的故障案例条目实现文本关键词匹配。
6、其中,在收到用户载入的故障案例文本后,通过案例抽样、标记解析和标记评估三个步骤完成文本关键词的挖掘,步骤如下:
7、步骤1:通过随机采样抽选部分已有案例,与新故障案例文本组合成为待分析案例,实现案例抽样;
8、步骤2:将抽样的案例通过分词模型,对于不同文本基于3-gram模型进行标记解析,作为关键词候选,实现标记解析;
9、步骤3:基于词频-逆文本频率指数评估下各关键词候选在各文本中的权重,将在某例新文本中权重高于1/3分位数、在已有文本中权重均不超过1/3分位数的关键词候选、且不属于已有关键词的词汇添加入新关键词集合;
10、步骤4:重复执行步骤1-3至设定次数。
11、其中,所述关键词权重计算公式为:
12、
13、式中:wx,y为关键词x在文本y中的权重,nx,y为关键词x在文本y中出现的次数,ny为文本y的总标记个数,dx为关键词x出现过的文本个数,d为文本个数。
14、其中,所述关键词图谱是由以关键词定义节点、以关键词间关联定义边的无向图模型,节点权重代表关键词的重要性,边权重代表关键词间的关联程度;关键词图谱更新涉及对于节点与边的补充操作及对节点权重与边权重的更新操作;从统计挖掘到的各关键词在文本中的词频,从而基于pagerank算法更新新文本所涉及的关键词间关系权重,进一步更新新文本所涉及的关键词权重,完成文本关键词建谱。
15、其中,根据用户已键入的关键词组合,自主判别关键词所对应的权重,通过正则匹配统计各案例条目匹配程度,排序并筛选匹配程度最高的前50项故障案例条目,步骤如下:
16、步骤1:将用户已键入的关键词组合按照等级进行分组;
17、步骤2:利用sql语句支持的正则替换功能,将各等级组关键词通过“或(|)”逻辑分别批量替换为“#”与“空字符”,两种替换方法的字符串长度差即为各组的关键词匹配次数;
18、步骤3:评估各故障案例在当前关键词组合下的匹配程度指标,并按照指标从高到低进行排序;
19、步骤4:实例化返回前50项故障案例条目。
20、其中,故障案例匹配程度指标计算公式为:
21、
22、式中:sy为故障案例y在当前关键词组合下的匹配程度指标,γi为关键词等级i的等级匹配程度权重,dleni为对关键词等级i的关键词等级组进行正则替换时的字符串长度差。
23、本专利技术还提供了一种基于关键词图谱的故障案例管理系统,包括文本关键词挖掘模块、文本关键词建谱模块和文本关键词匹配模块;故障案例载入涉及文本关键词挖掘模块和文本关键词建谱模块两项功能模块,文本关键词挖掘模块通过词频-逆文本频率指数更新文本关键词;文本关键词建谱模块将新挖掘到的文本关键词通过算法更新关键词图谱;
24、所述故障案例查询涉及文本关键词建谱模块和文本关键词匹配模块两项功能模块;文本关键词建谱模块通过关键词图谱根据用户已输入关键词组合推荐关键词;文本关键词匹配模块则通过用户定义的关键词组合来排序并筛选匹配的故障案例条目。
25、其中,所述文本关键词挖掘模块在收到用户载入的故障案例文本后,通过案例抽样、标记解析、标记评估完成文本关键词的挖掘;所述文本关键词建谱模块针对文本关键词挖掘模块所挖掘的新关键词,对于已有关键词图谱进行更新;所述文本关键词建谱模块根据用户已键入的关键词,衡量不同关键词的推荐分数,向用户推荐推荐分数最高的前10个关键词;所述文本关键词匹配模块根据用户已键入的关键词组合,自主判别关键词所对应的权重,通过正则匹配统计各案例条目匹配程度,排序并筛选匹配程度最高的前50项故障案例条目。
26、本专利技术还提供了一种电子设备,所述电子设备包括处理器、用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现本专利技术所述的基于关键词图谱的故障案例管理方法。
27、本分明还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行本专利技术所述的基于关键词图谱的故障案例管理方法。
28、有益效果:
29、1.本专利技术通过关键词挖掘和关键词匹配,面向案例规模庞大、故障类型复杂的故障案例检索需求,实现适用于多类型控制律逻辑的规范化评估方法,具体是基于词频-逆文本频率指数(tf-idf)的文本关键词挖掘、基于算法的文本关键词建谱和基于正则匹配的文本关键词匹配,构建面向sql数据库的故障案例检索方法,从而实现面向实际多类型故障的故障案例管理方法,进而支持实际工程中维修保障经验的有效应用。
30、2.本专利技术文本关键词挖掘是在收到用户载入的故障案例文本后,通过案例抽样、标记解析、标记评估三个步骤完成文本关键词的挖掘。
31、3.本专利技术方法中,文本关键词建谱过程中,针对文本关键词挖掘所本文档来自技高网...
【技术保护点】
1.一种基于关键词图谱的故障案例管理方法,其特征在于,涉及故障案例载入阶段和故障案例查询阶段;
2.如权利要求1所述的方法,其特征在于,在收到用户载入的故障案例文本后,通过案例抽样、标记解析和标记评估三个步骤完成文本关键词的挖掘,步骤如下:
3.如权利要求2所述的方法,其特征在于,所述关键词权重计算公式为:
4.如权利要求1-3任意一项所述的方法,其特征在于,所述关键词图谱是由以关键词定义节点、以关键词间关联定义边的无向图模型,节点权重代表关键词的重要性,边权重代表关键词间的关联程度;关键词图谱更新涉及对于节点与边的补充操作及对节点权重与边权重的更新操作;从统计挖掘到的各关键词在文本中的词频,从而基于PageRank算法更新新文本所涉及的关键词间关系权重,进一步更新新文本所涉及的关键词权重,完成文本关键词建谱。
5.如权利要求1-3任意一项所述的方法,其特征在于,根据用户已键入的关键词组合,自主判别关键词所对应的权重,通过正则匹配统计各案例条目匹配程度,排序并筛选匹配程度最高的前50项故障案例条目,步骤如下:
6.如权利
7.一种基于关键词图谱的故障案例管理系统,其特征在于,包括文本关键词挖掘模块、文本关键词建谱模块和文本关键词匹配模块;故障案例载入涉及文本关键词挖掘模块和文本关键词建谱模块两项功能模块,文本关键词挖掘模块通过词频-逆文本频率指数更新文本关键词;文本关键词建谱模块将新挖掘到的文本关键词通过算法更新关键词图谱;
8.如权利要求7所述的系统,其特征在于,所述文本关键词挖掘模块在收到用户载入的故障案例文本后,通过案例抽样、标记解析、标记评估完成文本关键词的挖掘;所述文本关键词建谱模块针对文本关键词挖掘模块所挖掘的新关键词,对于已有关键词图谱进行更新;所述文本关键词建谱模块根据用户已键入的关键词,衡量不同关键词的推荐分数,向用户推荐推荐分数最高的前10个关键词;所述文本关键词匹配模块根据用户已键入的关键词组合,自主判别关键词所对应的权重,通过正则匹配统计各案例条目匹配程度,排序并筛选匹配程度最高的前50项故障案例条目。
9.一种电子设备,其特征在于,所述电子设备包括处理器、用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-6中任一所述的基于关键词图谱的故障案例管理方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-6中任一所述的基于关键词图谱的故障案例管理方法。
...【技术特征摘要】
1.一种基于关键词图谱的故障案例管理方法,其特征在于,涉及故障案例载入阶段和故障案例查询阶段;
2.如权利要求1所述的方法,其特征在于,在收到用户载入的故障案例文本后,通过案例抽样、标记解析和标记评估三个步骤完成文本关键词的挖掘,步骤如下:
3.如权利要求2所述的方法,其特征在于,所述关键词权重计算公式为:
4.如权利要求1-3任意一项所述的方法,其特征在于,所述关键词图谱是由以关键词定义节点、以关键词间关联定义边的无向图模型,节点权重代表关键词的重要性,边权重代表关键词间的关联程度;关键词图谱更新涉及对于节点与边的补充操作及对节点权重与边权重的更新操作;从统计挖掘到的各关键词在文本中的词频,从而基于pagerank算法更新新文本所涉及的关键词间关系权重,进一步更新新文本所涉及的关键词权重,完成文本关键词建谱。
5.如权利要求1-3任意一项所述的方法,其特征在于,根据用户已键入的关键词组合,自主判别关键词所对应的权重,通过正则匹配统计各案例条目匹配程度,排序并筛选匹配程度最高的前50项故障案例条目,步骤如下:
6.如权利要求5所述的方法,其特征在于,故障案例匹配程度指标计算公式为:
7.一种基于关键词图谱的故障案例管理系统,其特征在于,包括文本关键词挖掘模块、文本关键词...
【专利技术属性】
技术研发人员:宋杰,王丽丽,谷立军,于劲松,江升柱,杜春蕾,袁占涛,周金浛,唐荻音,冯昭宇,韦志会,
申请(专利权)人:廊坊第六九一六仪器厂,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。