System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种关于危险化学品事故的事理图谱构建方法技术_技高网
当前位置: 首页 > 专利查询>浙江大学专利>正文

一种关于危险化学品事故的事理图谱构建方法技术

技术编号:40825317 阅读:2 留言:0更新日期:2024-04-01 14:46
本发明专利技术涉及一种关于危险化学品事故的事理图谱构建方法,包括:获取危险化学品的CAS号以及对应的MSDS信息;进行数据的预处理和标注;利用解码器预测事件类型,并抽取句子中的触发词和对应的事件论元;确定事件的表示向量,根据事件的相关性筛选事件对;并预测事件对之间的关系,构建事件关系图;将抽取出的事件使用RDF进行知识表示,构建事理图谱。本发明专利技术的有益效果是:本发明专利技术抽取事件并且进行事理图谱的搭建,将危险化学品的反应事件进行分门别类,然后表示出丰富的事件关系,利用事理图谱的强关联性,能对危险化学品事故更好的进行查询、预警、分析。

【技术实现步骤摘要】

本专利技术涉及知识图谱,更确切地说,它涉及一种关于危险化学品事故的事理图谱构建方法


技术介绍

1、安全生产的重要内容之一就是危化品安全。危化品具有多种危险特性,如毒害性、易燃性、易爆性等,无论是在生产、储存、使用、运输等任何环节,都有可能发生危险事故,给人们的生命财产安全带来巨大的危害,同时也会对环境造成严重的破坏。

2、物质安全数据单(material safety data sheet,msds)的内容通常包括:化学品及企业标识、危险性概述、成分/组成信息、急救措施、消防措施、泄漏应急处理、操作处置与储存等16项信息。物质安全数据单是化学品登记管理的重要基础和信息来源,可以指导化学品的安全生产、安全流通和安全使用。

3、事理图谱是一种用有向图来表示事件之间的逻辑关系(如顺承、因果等)的事理演化过程的图形化方法,它包含了丰富的事件间关系,对于各个领域都有着重要的研究价值和应用意义。目前的研究主要关注于公开域的事件抽取,而在特定领域,如危险化学品领域,由于其事件类型和事件内容比较复杂,相关研究还很少。因此,探究如何使用互联网公开信息和深度学习构建知识图谱对提高化工产业的安全性有重大意义。

4、申请号为cn202310560096.6的《一种化学品知识图数据库的构建方法及其构建装置》介绍了使用三元组进行构建的过程:从数据源获取涉及化学品知识的多条字段信息,如化学品名称、性质、危险等;根据知识图谱中的本体定义和本体约束,将字段信息映射为语义三元组,如<化学品,类型,危险化学品>;将语义三元组与数据源进行数据链接,获取连接数据源的数据三元组,如<甲醛,类型,危险化学品>;基于数据三元组,构建化学品知识图数据库,以图数据库的形式存储和查询化学品知识。但该专利仅仅能对危险化学品的属性进行静态的查询,不能查看事件的演化。

5、申请号为cn115953117a的《一种基于知识图谱的危险化学品事故知识库构建方法》作者提出了一个分析危险化学品事故原因的方法。方法利用深度学习模型和聚类算法对事故文本进行实体抽取和消歧,构建事故知识图谱和事故树,生成事故树模板库。方法还利用图查询语句和相关算法在事故树模板库和知识图谱中进行匹配和推理,发掘事故深层次原因。但该方法的构建形式复杂,而且泛化能力差。

6、申请号为cn116432647a的《融合多特征的bert-bilstm-crf危险化学品命名实体识别方法》提出了一种危险化学品命名实体识别方法。预先获取危险化学品数据并进行清洗和预处理,通过bert将文本表示成能够表达文本语义的向量;然后构建bilstm模型,用于提取上下文语义特征,引入注意力机制,学习更复杂的上下文序列特征;最后通过构建的crf部分,解码命名实体标签序列,识别危险化学品命名实体。具备较强的泛化能力和识别能力。但该方法仅仅是识别了命名实体,并没有对事件进行识别和关系分析,实用性较差。


技术实现思路

1、本专利技术的目的是针对现有技术的不足,提出了一种关于危险化学品事故的事理图谱构建方法。

2、第一方面,提供了一种关于危险化学品事故的事理图谱构建方法,包括:

3、步骤1、获取原始数据,所述原始数据包括危险化学品的cas号以及对应的msds信息;

4、步骤2、对所述原始数据进行预处理,所述预处理包括正则匹配和格式化;

5、步骤3、对预处理后的数据进行标注,标注元素包括事件文本、事件类型、事件触发词及其位置、事件论元及其位置;并将标注后的数据集划分为训练集、验证集和测试集三个部分;

6、步骤4、获取原始文本,利用解码器预测事件类型,并抽取句子中的触发词和对应的事件论元;所述原始文本为所述数据集中的文本;

7、步骤5、确定事件的表示向量,根据事件的相关性筛选事件对;并预测事件对之间的关系,构建事件关系图;

8、步骤6、将抽取出的事件使用rdf进行知识表示,构建事理图谱。

9、作为优选,步骤1中,爬取网页的html代码获取原始数据。

10、作为优选,步骤2包括:

11、步骤2.1、对所述html代码进行解析,获取对应的msds信息;

12、步骤2.2、进行正则匹配,提取文本;

13、步骤2.3、对于匹配到的数据,进行重新格式化,将其转换为键值对的形式。

14、作为优选,步骤3中,采用大语言模型进行数据标注。

15、作为优选,步骤4包括:

16、步骤4.1、获取原始文本,并使用bert模型对所述原始文本进行编码,得到所述原始文本中的每个单词的上下文表示;

17、步骤4.2、第一解码器通过注意力机制,将句子中的每个词的向量表示与每个候选事件类型的向量表示进行匹配,得到匹配得分;并将句子的向量表示与事件类型的向量表示再次进行匹配,得到概率值,若所述概率值大于预设阈值,则确定句子中存在该事件类型;

18、步骤4.3、在已知事件类型的情况下,使用第二解码器从句子中提取出事件的触发词;

19、步骤4.4、已知事件类型和触发词的情况下,从句子中提取出该事件的论元。

20、作为优选,步骤4.1中,事件类型预测公式为:

21、p(yt|x)=softmax(wtht+bt)

22、其中,x是输入句子,yt是第t个词的事件类型,ht是第t个词的隐藏状态,wt和bt是可学习的参数,softmax是激活函数;

23、步骤4.2中,触发词抽取公式为:

24、p(ys|x,yt)=softmax(wshs+bs)

25、其中,ys是第s个词的触发词标签,ws和bs是可学习的参数;

26、步骤4.3中,论元抽取公式为:

27、p(ya|x,yt,ys)=softmax(waha+ba)

28、其中,ya是第a个词的论元标签,wa和ba是可学习的参数。

29、作为优选,步骤5包括:

30、步骤5.1、使用图神经网络模型,将文本中的事件作为节点,并对节点编码,得到每个事件的向量表示;

31、步骤5.2、使用注意力的方法,计算每个事件向量与其他事件向量的相似度,得到候选的事件对;

32、步骤5.3、使用bert的模型,将候选的事件对及其所在的文本作为输入,得到向量表示;

33、步骤5.4、使用多层感知器,对每个向量表示进行分类,预测出事件对之间的关系类型;

34、步骤5.5、根据预测的关系类型,将事件对连接起来,形成事件关系图。

35、作为优选,步骤6包括:

36、步骤6.1、对事件进行知识表示,将知识表示为三元组的形式;

37、步骤6.2、将事理图谱整理格式后导入图数据库中;

38、步骤6.3、进行事理图谱的可视化;

39、步骤6.4、将事本文档来自技高网...

【技术保护点】

1.一种关于危险化学品事故的事理图谱构建方法,其特征在于,包括:

2.根据权利要求1所述的关于危险化学品事故的事理图谱构建方法,其特征在于,步骤1中,爬取网页的HTML代码获取原始数据。

3.根据权利要求2所述的关于危险化学品事故的事理图谱构建方法,其特征在于,步骤2包括:

4.根据权利要求3所述的关于危险化学品事故的事理图谱构建方法,其特征在于,步骤3中,采用大语言模型进行数据标注。

5.根据权利要求4所述的关于危险化学品事故的事理图谱构建方法,其特征在于,步骤4包括:

6.根据权利要求5所述的关于危险化学品事故的事理图谱构建方法,其特征在于,步骤4.1中,事件类型预测公式为:

7.根据权利要求6所述的关于危险化学品事故的事理图谱构建方法,其特征在于,步骤5包括:

8.根据权利要求7所述的关于危险化学品事故的事理图谱构建方法,其特征在于,步骤6包括:

9.一种关于危险化学品事故的事理图谱构建系统,其特征在于,用于执行权利要求1至8任一所述的关于危险化学品事故的事理图谱构建方法,包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的可执行程序,其中,在所述可执行程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至8任一所述的关于危险化学品事故的事理图谱构建方法。

...

【技术特征摘要】

1.一种关于危险化学品事故的事理图谱构建方法,其特征在于,包括:

2.根据权利要求1所述的关于危险化学品事故的事理图谱构建方法,其特征在于,步骤1中,爬取网页的html代码获取原始数据。

3.根据权利要求2所述的关于危险化学品事故的事理图谱构建方法,其特征在于,步骤2包括:

4.根据权利要求3所述的关于危险化学品事故的事理图谱构建方法,其特征在于,步骤3中,采用大语言模型进行数据标注。

5.根据权利要求4所述的关于危险化学品事故的事理图谱构建方法,其特征在于,步骤4包括:

6.根据权利要求5所述的关于危险化学品事故的事理图谱构建方法,其特征在于,...

【专利技术属性】
技术研发人员:孔振华陈观林翁文勇杨武剑
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1