【技术实现步骤摘要】
基于文本挖掘的电力人身伤亡事故关键隐患因素提取方法
[0001]本专利技术涉及安全管理
,具体涉及一种基于文本挖掘的电力人身伤亡事故关键隐患因素提取方法。
技术介绍
[0002]随着我国电网发展和电网复杂程度越来越高,以及我国经济发展带来的电力需求逐渐增长,电力生产安全问题日益重要。电力人身伤亡事故即在电力行业的生产、工程建设、营销及产业领域过程中造成人身伤亡的事件,其往往包括触电、高处坠落、物体打击、坍垮塌压埋等事故类型,严重威胁多方人员的生命安全,影响电力企业和国家经济发展,急需找出事故原因,预防事故发生;因此,提供一种筛选与提取电力人身伤亡事故关键隐患因素、为电力企业的事故预防工作提供参考的基于文本挖掘的电力人身伤亡事故关键隐患因素提取方法是非常有必要的。
技术实现思路
[0003]本专利技术的目的是为了克服现有技术的不足,而提供一种筛选与提取电力人身伤亡事故关键隐患因素、为电力企业的事故预防工作提供参考的基于文本挖掘的电力人身伤亡事故关键隐患因素提取方法。
[0004]本专利技术的目的是这样实现的:基于文本挖掘的电力人身伤亡事故关键隐患因素提取方法,它包括以下步骤:
[0005]步骤1:文本搜集,文本搜集来源于国家能源局电力安全监管司编写的《全国电力事故和电力安全事件汇编》(2014
‑
2018年);
[0006]步骤2:文本存储,存储每篇事故报告中的包括事故简述和事故原因;
[0007]步骤3:文本预处理,由于电力人身伤亡事故报告中的大 ...
【技术保护点】
【技术特征摘要】
1.基于文本挖掘的电力人身伤亡事故关键隐患因素提取方法,其特征在于:它包括以下步骤:步骤1:文本搜集,文本搜集来源于国家能源局电力安全监管司编写的《全国电力事故和电力安全事件汇编》(2014
‑
2018年);步骤2:文本存储,存储每篇事故报告中的包括事故简述和事故原因;步骤3:文本预处理,由于电力人身伤亡事故报告中的大量文本数据具有冗余性、不完整性及复杂性特点,因此首先需要对其内容进行预处理操作,以提升文本挖掘的效果;步骤4:文本挖掘,通过词云分析技术对文本数据中出现频率较高的“关键词”进行突出显示,将这些“关键词”形成像云一样的彩色图片,从而使得浏览者能够一眼领略或了解文本所传达的主旨;步骤5:实验结果分析及对比,运用词数统计和TF
‑
IDF相结合的词频统计方法,首先对隐患因素相关词语设定词数统计阈值α=5,从中筛选出隐患因素相关重要词语;之后,分别计算得到各隐患因素相关重要词语的三个特征值:各隐患因素相关重要词语数(C
ijk
)、各隐患因素相关重要词语的综合累计频数(Q
ijk
)和各隐患因素相关重要词语的综合平均最高TF
‑
IDF值最后,基于实验结果的总体分布情况设定阈值如下:对于某个具体隐患因素AP
ij
(i=1,2,
…
,4;j=1,2,
…
,13)来说,若C
ijk
≥10,Q
ijk
≥200且则认为该隐患因素为电力人身伤亡事故关键隐患因素;步骤6:构建电力人身伤亡事故关键隐患因素体系,最终构建的电力人身伤亡事故关键隐患因素体系涉及人、物、管理三个方面。2.如权利要求1所述的基于文本挖掘的电力人身伤亡事故关键隐患因素提取方法,其特征在于:所述步骤3中,文本预处理方法包括停用词过滤、中文分词、自定义词典;停用词过滤:原始事故报告文本中存在着大量的标点符号如“,”“、
”“……”
和对于实验目的来说无意义的字词如“着”、“的”、“十分”、“有限公司”、“供电所”,将这些标点符号、无效字词去除,因此首先定义停用词表过滤文本内容;中文分词:在电力人身伤亡事故报告中,隐藏在完整语句中的某些特定词语代表了所要挖掘和提取的电力人身伤亡事故关键隐患因素的具体内涵,如“砌筑小工头李晓X自我保护意识淡薄,安全意识差”中的“自我保护意识”和“安全意识”都直接反映了该起事故的发生与人员隐患中的工作技能水平/知...
【专利技术属性】
技术研发人员:卢丹,张建立,许长清,张琳娟,郭祥富,邱超,韩军伟,周志恒,陈婧华,
申请(专利权)人:国家电网有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。