一种危化品信息管理方法、装置、设备和可读存储介质制造方法及图纸

技术编号:39292005 阅读:21 留言:0更新日期:2023-11-07 10:59
本申请公开了一种危化品信息管理方法、装置、设备和可读存储介质,方法包括:确定目标数据源,并对目标数据源中的各条危化品信息进行抓取收集,经数据清洗和数据质量控制处理后整理生成初始危化品数据;对初始危化品数据进行预处理,生成危化品标注数据;选择与危化品标注数据匹配的目标提取方式,并利用目标提取方式对危化品标注数据进行特征提取,得到危化品数值特征;获取预先构建并训练完成的与用户管理需求匹配的目标危化品分析模型,并利用目标危化品分析模对危化品数值特征进行知识抽取和汇总,生成可视化分析结果。本申请解决了数据质量和不统一问题,去除了复杂冗余信息,将其应用于实际的工作场景中,将大大提高工作效率和准确性。率和准确性。率和准确性。

【技术实现步骤摘要】
一种危化品信息管理方法、装置、设备和可读存储介质


[0001]本申请涉及信息处理领域,更具体地说,涉及一种危化品信息管理方法、装置、设备和可读存储介质。

技术介绍

[0002]危化品即危险化学品,是指具有易燃、易爆、有毒、有害和放射性等特性,在运输装卸和储存保管过程中易造成人员伤亡和财产损毁而需要特别保护的化学物品。危化品行业由于其行业特殊性和复杂性,存在以下信息管理困难:
[0003]第一、由于其危险性,危化品行业涉及到许多复杂的信息和规定,例如危险品分类、存储要求、运输要求等,信息冗余繁杂。
[0004]第二、由于危化品行业的信息可能来自多个渠道和格式,数据的质量和一致性没有保障,这个就导致信息收集汇总时的困难。
[0005]第三、危化品行业属于特殊技术行业,存在有行业内的特定术语和规则。
[0006]基于此,本申请提供了一种针对危化品行业的危化品信息管理方案,以解决上述问题。

技术实现思路

[0007]有鉴于此,本申请提供了一种危化品信息管理方法、装置、设备和可读存储介质,解决了数据质量和不本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种危化品信息管理方法,其特征在于,包括:确定目标数据源,并对所述目标数据源中的各条危化品信息进行抓取收集,经数据清洗和数据质量控制处理后整理生成初始危化品数据;对所述初始危化品数据进行预处理,生成危化品标注数据;在预置的若干特征提取方式中选择与所述危化品标注数据匹配的目标提取方式,并利用所述目标提取方式对所述危化品标注数据进行特征提取,得到能够表达语义和结构信息的危化品数值特征;获取预先构建并训练完成的与用户管理需求匹配的目标危化品分析模型,并利用所述目标危化品分析模对所述危化品数值特征进行知识抽取和汇总,生成可视化分析结果。2.根据权利要求1所述的方法,其特征在于,所述确定目标数据源,并对所述目标数据源中的各条危化品信息进行抓取收集,经数据清洗和数据质量控制处理后整理生成初始危化品数据,包括:确定目标数据源,并使用对应的数据抓取工具和抓取形式对所述目标数据源中的各条危化品信息进行抓取收集,得到抓取危化品数据;依次通过去噪、数据筛选、数据结果规范化、数据结果标准化以及缺失数据处理对所述抓取危化品数据进行数据清洗;对清洗后的数据进行验证和数据一致性检查,并在验证检查通过后整理生成初始危化品数据。3.根据权利要求1所述的方法,其特征在于,对所述初始危化品数据进行预处理,生成危化品标注数据,包括:对所述初始危化品数据进行分词,并对分词后的文本进行词性标注,生成第一标注数据;识别所述第一标注数据中的命名实体并标注,生成第二标注数据;对所述第二标注数据进行文本规范化和文本向量化,生成第三标注数据;通过抽取各命名实体之间的关系,对所述第三标注数据进行实体关系标注,生成危化品标注数据。4.根据权利要求3所述的方法,其特征在于,在通过抽取各命名实体之间的关系,对所述第三标注数据进行实体关系标注,生成危化品标注数据之前,还包括:对所述第三标注数据中的各所述命名实体进行同义词替换和归一化处理。5.根据权利要求3所述的方法,其特征在于,在通过抽取各命名实体之间的关系,对所述第三标注数据进行实体关系标注,生成危化品标注数据之前,还包括:按照用户设定的停用...

【专利技术属性】
技术研发人员:潘锋蔡建华刘晓峰袁刚
申请(专利权)人:广州宏算信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1