【技术实现步骤摘要】
基于自然语言处理化学品事故案例的方法及系统
[0001]本专利技术涉及自然语言处理
,具体地涉及一种基于自然语言处理化学品事故案例的方法以及一种基于自然语言处理化学品事故案例的系统。
技术介绍
[0002]石化行业具有高温高压、易燃易爆、有毒有害、腐蚀性强等特点,同时,由于资金密集、装置大型化、工艺复杂、连续作业、点多面广,任何一项设备隐患、制度缺陷、程序遗漏、工作疏忽或个人违章都可能造成事故,引发严重后果。事故研究的主要目的是查清事故发生的过程,分析事故发生的原因,研究事故发展的规律,吸取事故教训,提出有针对性的整改措施,进而改善企业的安全管理系统,避免类似事故的重复发生。
[0003]目前石化事故信息的收集还处在依靠人工录入到信息化系统的阶段,目前获取事故信息后由人工录入、分级的工作方式,无法及时、全面的掌握事故信息,导致事故录入效率低,缺乏有效的智能化处理手段是事故案例管理分析的主要缺点。
技术实现思路
[0004]本专利技术实施方式的目的是提供一种基于自然语言处理化学品事故案例的方法和系 ...
【技术保护点】
【技术特征摘要】
1.一种基于自然语言处理化学品事故案例的方法,其特征在于,所述方法包括:获取化学品事故短文本数据,确定所述化学品事故短文本数据对应的事故类别;通过分析所述化学品事故短文本数据,得到所述化学品事故短文本数据的依存句法结构;根据所述依存句法结构,从所述化学品事故短文本数据中提取化学品事故关键信息;根据所述化学品事故关键信息对化学品事故进行分级,按照化学品事故等级存储所述化学品事故短文本数据、所述事故类别和所述化学品事故关键信息。2.根据权利要求1所述的基于自然语言处理化学品事故案例的方法,其特征在于,所述事故类别至少包括火灾、爆炸、泄漏以及中毒。3.根据权利要求1所述的基于自然语言处理化学品事故案例的方法,其特征在于,所述获取化学品事故短文本数据,确定所述化学品事故短文本数据对应的事故类别,包括:通过网络爬虫爬取化学品事故短文本数据;对爬取的化学品事故短文本数据去重;对去重后的化学品事故短文本数据进行分类处理,确定所述化学品事故短文本数据对应的事故类别。4.根据权利要求1所述的基于自然语言处理化学品事故案例的方法,其特征在于,所述获取化学品事故短文本数据,确定所述化学品事故短文本数据对应的事故类别,包括:手动录入化学品事故短文本数据;对录入的化学品事故短文本数据进行分类处理,确定所述化学品事故短文本数据对应的事故类别。5.根据权利要求3或4所述的基于自然语言处理化学品事故案例的方法,其特征在于,所述分类处理,包括:采用基于逻辑回归算法的化学品事故短文本分类器对去重后的化学品事故短文本数据或录入的化学品事故短文本数据进行分类处理。6.根据权利要求1所述的基于自然语言处理化学品事故案例的方法,其特征在于,所述通过分析所述化学品事故短文本数据,得到所述化学品事故短文本数据的依存句法结构,包括:采用基于神经网络的依存句法分析模型分析所述化学品事故短文本数据,得到化学品事故短文本数据的依存句法结构:W
s
:W
s
(R1,R2,
…
R
i
…
,R
n
)(i∈[1,n])其中,W
s
表示所述化学品事故短文本数据的依存句法分析结果,R
n
表示所述化学品事故短文本数据的依存句法结构。7.根据权利要求6所述的基于自然语言处理化学品事故案例的方法,其特征在于,所述依存句法结构包括:主谓关系、动宾关系、间宾关系、前置宾语、兼语、定中关系、状中结构、动补结构、并列关系、介宾关系、左附加关系、右附加关系、独立结构和核心关系。8.根据权利要求1所述的...
【专利技术属性】
技术研发人员:侯孝波,张广文,孙万付,曲开顺,袁纪武,卢均臣,
申请(专利权)人:中国石油化工股份有限公司中国石油化工股份有限公司青岛安全工程研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。