一种智能IETM故障维修记录文本的知识挖掘方法技术

技术编号:23315567 阅读:47 留言:0更新日期:2020-02-11 17:58
本发明专利技术公开了一种智能IETM故障维修记录文本的知识挖掘方法,包括步骤:一、收集设备故障维修记录文本数据;二、建立设备故障词库;三、获取词项文档矩阵;四、生成主题文档矩阵;五、训练标签特征矩阵;六、构建神经网络;七、设备故障维修记录文本的分类。本发明专利技术利用LDA主题模型对词项文档矩阵特征提取,得到标签特征矩阵,提供故障维修记录文本的分类标签,快速对设备故障维修记录文本分类,并且分类结果准确,另外将卷积神经网络中的池化层替换成循环层,卷积神经网络中卷积层具有共享权值的优点、循环层具有解决文本长期依赖关系的问题的优点,为智能IETM平台中故障维修辅助系统提供了充足的知识数据。

A knowledge mining method of intelligent IETM fault maintenance record text

【技术实现步骤摘要】
一种智能IETM故障维修记录文本的知识挖掘方法
本专利技术属于知识挖掘
,具体涉及一种智能IETM故障维修记录文本的知识挖掘方法。
技术介绍
在人机交互技术、大数据技术、虚拟现实技术等技术的不断推动下,传统的IETM(InteractionElectronicTechnicalManuel)已经不能满足装备的故障维修和保障工作的需求。智能IETM应具有自动学习的思维逻辑,正确的分析和判断能力,其中知识是不可缺少的组成元素。文本知识挖掘是从包含大量噪声的设备运行状况信息数据中提取有效的知识数据,完成故障诊断知识的获取。知识获取是整个智能IETM故障维修辅助系统的核心,同时也是重点和难点。解决知识获取困难问题,便于完成智能IETM故障维修辅助知识库的建立。目前,故障维修记录文本信息主要采用自然语言处理技术,针对故障维修记录文本数据本身的特点,将一些通用的文本处理算法应用到设备故障维修记录文本知识挖掘处理领域,主要是对文本预处理和特征提取等一些操作。目前在智能IETM故障维修领域中仍存在对文本处理不足的问题:第一,在设备故障维修文本特征本文档来自技高网...

【技术保护点】
1.一种智能IETM故障维修记录文本的知识挖掘方法,其特征在于,该方法包括以下步骤:/n步骤一、收集设备故障维修记录文本数据:设备数据收集人员通过智能IETM平台对设备故障维修记录文本数据进行采集和记录,故障维修记录文本数据以自然语言的形式记录在设备故障维修记录表中,所述设备故障维修记录表包括故障原因编码、故障原因描述、维修措施和反映问题描述,其中,故障原因编码表示故障原因的唯一标识符号;故障现象描述表示设备运行过程中出现故障时发生的现象描述;故障原因描述表示从故障原因描述中,由本领域专业人员确定故障出现的原因情况;维修措施表示针对当前出现的故障而采取对应维修措施的方案;/n步骤二、建立设备故...

【技术特征摘要】
1.一种智能IETM故障维修记录文本的知识挖掘方法,其特征在于,该方法包括以下步骤:
步骤一、收集设备故障维修记录文本数据:设备数据收集人员通过智能IETM平台对设备故障维修记录文本数据进行采集和记录,故障维修记录文本数据以自然语言的形式记录在设备故障维修记录表中,所述设备故障维修记录表包括故障原因编码、故障原因描述、维修措施和反映问题描述,其中,故障原因编码表示故障原因的唯一标识符号;故障现象描述表示设备运行过程中出现故障时发生的现象描述;故障原因描述表示从故障原因描述中,由本领域专业人员确定故障出现的原因情况;维修措施表示针对当前出现的故障而采取对应维修措施的方案;
步骤二、建立设备故障词库:利用结巴分词工具和哈工大停用词表对收集的设备故障维修记录文本数据进行分词并去噪,在利用人工筛选的方式建立设备故障词库;
步骤三、获取词项文档矩阵:利用词袋假设对设备故障词库中的词项进行分析,并建立设备故障词库中词项的词项文档矩阵;
步骤四、生成主题文档矩阵,过程如下:
步骤401、根据公式计算词项文档矩阵中第i个词项wordi的词频TFi,其中,f(wordi)为表示第i个词项wordi在词项文档矩阵中出现的次数,n表示词项文档矩阵中词项的总数;
步骤402、根据公式计算词项文档矩阵中出现第i个词项wordi的文档频率IDFi,其中,d表示文档,sum(d)表示词项文档矩阵中总的文档数目,N{d,wordi∈d}表示词项文档矩阵中包含第i个词项wordi的文档总数目;
步骤403、根据公式wi=TFi×IDFi,计算词项文档矩阵中第i个词项wordi的权重值wi;
步骤404、将词项文档矩阵中n个词项的权重值从高到底进行降序排列,选取权重值排前[0.3n]~[0.4n]的词项作为主题,主题值即为[0.3n]~[0.4n],其中,[·]为取整函数;
步骤405、利用LDA主题模型对词项文档矩阵进行降维与特征提取处理,将文档中词项空间...

【专利技术属性】
技术研发人员:李爱国张晓云
申请(专利权)人:西安科技大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1