面向过程安全分析的信息标准化方法技术

技术编号:21952219 阅读:38 留言:0更新日期:2019-08-24 17:38
本发明专利技术涉及一种面向过程安全分析的数据标准化存储方法,包括:从HAZOP分析文档中读取数据,对读取的数据进行预处理,构建领域词汇表,对HAZOP处理文档进行标准化处理,提取关键信息并存储在OWL文档中。该方法通过使用自然语言处理技术从文本中提取数据并将其存储在owl文档中,将HAZOP分析文档转换为知识本体,将不同的HAZOP分析产生的数据格式统一,使得数据具有良好的重用性。实现了HAZOP分析数据的存储与共享,使大量数据得到有效利用,为HAZOP分析安全评估提供了保障。

Information Standardization Method for Process Security Analysis

【技术实现步骤摘要】
面向过程安全分析的信息标准化方法
本专利技术涉及一种数据标准化与存储方法,具体涉及一种面向过程安全分析的信息标准化方法。
技术介绍
在原油和天然气的加工过程中,由于工艺复杂,不可避免地会出现各种意外错误。为了避免人员伤亡和经济损失,安全分析对设备尤其重要。过程危害分析(PHA)对于主动识别潜在的安全问题并建议可行的缓解措施非常重要。在现有的PHA技术中,危险和可操作性(HAZOP)分析是原油和天然气加工过程中使用最广泛的分析。传统的HAZOP分析方法大多采用头脑风暴的形式,并将讨论结果记录在电子文档中。但这种方法耗时,费力且昂贵,该方法依赖于HAZOP分析专家的经验,大量形式不同的HAZOP分析报表造成重用率低资源浪费。为了解决这个问题,一些专家设计了软件来辅助HAZOP分析,以提高HAZOP的分析效率。但是,由于无法实现自动分析,HAZOP分析的效率无法从源头得到改善。其他一些专家通过使用规则HAZOP和模型开发了自动HAZOP分析软件,可以大大减少人工工作量和人为分析的错误概率,使得系统安全分析的效率达到很高的水平,但这两种方法产生的数据格式不同,无法达到数据分享的目的。
技术实现思路
针对现有技术中的不足,本专利技术的目的是提供一种面向过程安全分析的信息标准化方法,以实现HAZOP分析数据的存储与共享。本专利技术的目的是采用下述技术方案实现的:一种面向过程安全分析的数据标准化存储方法,包括:从HAZOP分析文档中读取数据;对读取的数据进行预处理,得到HAZOP处理文档;构建领域词汇表;根据领域词汇表对HAZOP处理文档进行标准化处理;提取关键信息并存储在OWL文档中。进一步的,所述读取数据包括读取HAZOP分析文档中每个分析节点的原因数据,偏差数据和结果数据。进一步的,采用自然语言处理技术对读取的数据进行预处理。进一步的,所述对读取的数据进行预处理包括中文分词,词性标注和删除停用词。进一步的,所述停用词包括空字符,标点符号和不重要词汇。进一步的,使用IEC-61882国际标准构建领域词汇表。进一步的,所述领域词汇表包含领域名词和IEC-61882国际标准中的词汇。进一步的,所述对HAZOP处理文档进行标准化处理具体包括:计算所述HAZOP处理文档中的单词与所述领域词汇表中单词的相似度;若计算得到的相似度一致,判定HAZOP处理文档中的单词为同义词,并将所述同义词替换为领域词汇表中的单词;若计算得到的相似度不同,记录单词并手动存储。进一步的,采用HIT-IR同义词词林计算所述HAZOP处理文档中的单词与所述领域词汇表中单词的相似度。进一步的,使用自然语言处理技术和所述领域词汇表提取关键信息并存储在OWL文档中。本申请提供的技术方案可以包括以下有益效果:本专利技术提出的一种面向过程安全分析的信息标准化方法,该方法使用自然语言处理技术从文本中提取数据并将其存储在owl文档中,将HAZOP分析文档转换为知识本体,将不同的HAZOP分析产生的数据格式统一,使得数据具有良好的重用性。此外还实现了HAZOP分析数据的存储与共享,使大量数据得到有效利用,为HAZOP分析安全评估提供了保障。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是信息标准化方法流程图;图2是危险情景环示意图;具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将对本专利技术的技术方案进行详细的描述。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本专利技术所保护的范围。第一优选技术方案图1为信息标准化方法流程图,如图1所示,包括以下步骤:步骤1.从HAZOP分析文档中读取数据;HAZOP分析过程主要包括节点划分,确定偏差和风险等级确定等,通过检查每个过程出现偏差的原因和结果,以确定哪些偏差是不可接受的,最后提出改进建议以提高过程安全性和可靠性。在HAZOP分析文档中,由于文档中的数据并不规则,在读取文档数据的过程中,需要将无关的数据过滤掉,只读取HAZOP分析文档中每个分析节点的原因,偏差和结果等参数数据。步骤2.对读取的数据进行预处理,得到HAZOP处理文档;本专利技术采用自然语言处理技术对读取的数据进行预处理,包括中文分词,词性标注和删除停用词。自然语言处理技术(NLP)是人与计算机之间以自然语言进行交流的技术,主要任务包括词法分析、句法分析和语义分析,其中语法分析包括中文分词和词性标注。中文分词是将一个句子逐个分成若干个单词,中文分词的模型很多,一些组织还集成了如分词和词性标注等功能的系统,为用户提供API。本专利技术采用分词工具ICTCLAS5.0进行中文分词,并对每个单词按照表1所示的部分中文词性标准进行词性标注,如果句子中出现停用词,则将该停用词从句子中删除。所述停用词来源于停用词表,主要包括空字符,标点符号以及其他不重要词汇。表1部分中文词性标准词性编码词性名称n名词d副词m数词nr人名ns地名p介词r代词步骤3.构建领域词汇表;本专利技术根据知识本体规则构建领域词汇表。所述领域词汇表由IEC-61882国际标准构建而成,包含领域名词和IEC-61882国际标准中的词汇。其中IEC-61882国际标准是过程工厂集成标准,是危险和可操作性分析的应用指南,也是HAZOP计算机信息存储和构建知识库的标准,可以有效实现集成,共享和交换HAZOP分析数据。使用IEC-61882国际标准构建的领域词汇表定义了该领域识别的词汇知识,使领域知识标准化,还可以用于存储特定域中的数据信息,利用某些工具获取知识,实现知识的共享和重用。构建领域词汇表的关键是获取领域信息,获取领域信息的常用方法是使用每个主题区域的主题词汇表和分类表。本专利技术使用自然语言技术从文本文档或数据库中获取,并选择OWL作为存储本体知识的语言。步骤4.对HAZOP处理文档进行标准化处理;首先计算所述HAZOP处理文档中的单词与所述领域词汇表中单词的相似度;若计算得到的相似度一致,则判定HAZOP处理文档中的单词为同义词,并将所述同义词替换为领域词汇表中的单词;若计算得到的相似度不同,记录单词并手动存储。本专利技术使用HIR-IR同义词词林(哈尔滨工业大学信息检索实验室,HIT-IR)计算相似度。HIR-IR同义词词林提供了三层编码,大类用大写英文字母表示,中间类用小写英文字母表示,小类用两个十进制整数表示。为方便起见,又分了4级和5级,4级由大写英文字母表示,5级由两个十进制整数表示。将编码的第4级和第5级与原始的三级编码相结合并形成完整的编码,此编码是出现在字典中的单词的唯一代表,共7位编码。第5级的分类结果需要特殊说明,例如,某些行是同义词,某些行是相关词。所以它添加“#”或“=”或“@”来表示第八个编码。“=”的含义是“相等”和“同义”,“#”的含义是“不等”和“相似”,“@”的含义是“不等”和“不同”。如果HAZOP处理文档中的单词与所述领域词汇表中的单词具有本文档来自技高网...

【技术保护点】
1.一种面向过程安全分析的数据标准化存储方法,其特征在于,包括:从HAZOP分析文档中读取数据;对读取的数据进行预处理,得到HAZOP处理文档;构建领域词汇表;根据领域词汇表对HAZOP处理文档进行标准化处理;提取关键信息并存储在OWL文档中。

【技术特征摘要】
1.一种面向过程安全分析的数据标准化存储方法,其特征在于,包括:从HAZOP分析文档中读取数据;对读取的数据进行预处理,得到HAZOP处理文档;构建领域词汇表;根据领域词汇表对HAZOP处理文档进行标准化处理;提取关键信息并存储在OWL文档中。2.根据权利要求1所述的数据标准化存储方法,其特征在于,所述读取数据包括读取HAZOP分析文档中每个分析节点的原因数据,偏差数据和结果数据。3.根据权利要求1所述的信息标准化方法,其特征在于,采用自然语言处理技术对读取的数据进行预处理。4.根据权利要求1所述的信息标准化方法,其特征在于,所述对读取的数据进行预处理包括中文分词,词性标注和删除停用词。5.根据权利要求4所述的信息标准化方法,其特征在于,所述停用词包括空字符,标点符号和不重要词汇。6.根据权利要求1所述的信息标准化方法,其特征在于,使...

【专利技术属性】
技术研发人员:高东肖遥
申请(专利权)人:北京化工大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1