一种承压类特种设备安全风险分析方法及终端技术

技术编号:38419976 阅读:12 留言:0更新日期:2023-08-07 11:21
本发明专利技术涉及一种承压类特种设备安全风险分析方法,针对承压类特种设备检验发现问题的文本描述进行识别、分析,创新构建一套承压类特种设备检验检测结果风险分析方法,能够从数据中发现存在中高风险隐患的承压类特种设备,为承压类特种设备检验检测结果风险分类体系的构建提供支撑,为监察机构提供精准的区域性的承压类特种设备本体缺陷中、高风险提醒,从而为承压类特种设备检验与安全监管工作提供标靶,实现智慧监管的目的。实现智慧监管的目的。实现智慧监管的目的。

【技术实现步骤摘要】
一种承压类特种设备安全风险分析方法及终端


[0001]本专利技术属于一种设备检测
,具体涉及一种承压类特种设备安全风险分析方法及终端。

技术介绍

[0002]承压类特种设备是工业化生产中必不可少的设备,同时也是现代社会中必备的生活设施,在经济社会发展中发挥着越来越重要的作用,但随着设备数量的增长,其安全问题也日益凸显,科学有效的风险管理是保障承压类特种设备安全的有效方式之一,逐渐受到监管部门的重视。
[0003]目前承压类特种设备监管方式主要以人工方式为主,暂未有效对承压类特种设备进行分级分类风险管理,对少数存在风险隐患的承压类特种设备也可能存在疏漏,并且也未能较好地运用成熟的大数据分析技术为监管工作提供保障支撑,大数据分析技术在该领域的应用较为空白。

技术实现思路

[0004]为了解决上述问题,本专利技术提供一种承压类特种设备安全风险分析方法及终端,能识别存在安全风险的承压类特种设备。
[0005]本专利技术的技术方案如下:
[0006]一种承压类特种设备安全风险分析方法,所述方法步骤如下:
[0007]步骤S1、获取承压类特种设备bert增量预训练模型数据集;
[0008]步骤S2、构建数据集的中文词汇切分表;
[0009]步骤S3、运用数据集和中文词汇切分表对bert模型进行增量预训练,获得承压类特种设备的bert预训练模型;
[0010]步骤S4、构建承压类特种设备检验发现隐患部件、关键词与风险分类等级规则对应的数据表;
[0011]步骤S5、获取检验记录数据和设备档案数据,结合两种数据并从中提取出设备关键参数与检验不合格项数据;
[0012]步骤S6、通过bert增量预训练模型计算各部件或设备整体的不合格描述的句向量,计算各不合格描述文本的余弦距离,以句向量和余弦距离构建承压类特种设备风险隐患识别分析模型输入表;
[0013]步骤S7、根据所述承压类特种设备风险隐患识别分析模型输入表中的数据计算对应数据余弦距离的数学期望,关联设备和部件,然后通过K

medoids算法进行聚类,并选择出最优聚类模型;
[0014]步骤S8、对比分析最优聚类模型中各类不合格描述关联的部件和关键词在风险分类等级规则表中对应的风险等级,找出存在隐患的承压类特种设备;
[0015]步骤S9、读取中风险和高风险隐患承压类特种设备的信息,形成输出结果。
[0016]进一步的,所述步骤S1进一步具体为:步骤S11、获取承压类特种设备检验不合格项的文本描述作为bert增量预训练模型数据集。
[0017]进一步的,所述步骤S2进一步具体为:
[0018]步骤S21、以检验发现的隐患部件为单位细分bert增量预训练模型数据集,记为表A;
[0019]步骤S22、对表A进行特殊字符和数学符号的剔除;
[0020]步骤S23、构建承压类特种设备检验专业词典D1;
[0021]步骤S24、运用LTP分词工具,结合D1表A以词为单位进行拆分,形成分词结果表,记为A1;
[0022]步骤S25、运用bert模型分词器对表A以字为单位进行拆分,形成分词结果表,记为表A2;
[0023]步骤S26、将表A2拆分的字按顺序连接组成词汇,与表A1对应的数据进行比对,筛选出A2在A1词长度大于1的词,并保留词的第一个字以外的字在A2的位置序号,形成中文词汇切分表,记为表B;
[0024]步骤S27、将表A的数据按比例随机分为训练集train和验证集eval;
[0025]步骤S28、根据步骤S27得到的训练集train和验证集eval筛选出在表B中相应的中文词汇切分表,记为train_ref和eval_ref。
[0026]进一步的,所述步骤S3包括以下步骤:
[0027]步骤S31、运用bert模型分词器分别对train和eval以字为单位进行拆分,并标识每个字对应的位置序号,形成分词结果,记为C1和C2;
[0028]步骤S32、C1与train_ref一一对应后进行数据合并形成最终训练集数据,记为train_end;
[0029]步骤S33、C2与eval_ref一一对应后进行数据合并形成最终验证集数据,记为eval_end;
[0030]步骤S34、设置训练参数,以train_end和eval_end为数据集构建增量预训练模型,进行全词掩码的掩码语言模型增量预训练,形成承压类特种设备检验领域的bert预训练模型,记为bert

pretrain模型。
[0031]进一步的,所述步骤S5包括以下步骤:
[0032]步骤S51、过滤删除复检合格与复检不合格记录;
[0033]步骤S52、提取检验记录中包括不合格的设备号、检验ID、安装区域和设备类别的关键参数数据与检验不合格项数据。
[0034]进一步的,所述步骤S6包括以下步骤:
[0035]步骤S61、以检验发现的隐患部件为单位细分设备的检验不合格项数据,记为表E;
[0036]步骤S62、对表E进行数学符号和特殊字符的剔除;
[0037]步骤S63、运用bert

pretrain模型的分词器对表E进行分词,并标识每个字的位置序号,形成不合格描述关键词表,记为E1;
[0038]步骤S64、获取表E1中各不合格描述的句向量,各不合格描述的句向量是通过对不合格描述关键词表中每个词在bert模型隐藏层中的倒数第二个隐藏层求平均,生成一个768长度的向量;
[0039]步骤S65、获取表E1中各不合格描述的余弦距离,各不合格描述的余弦距离是指各不合格描述的句向量与其他不合格描述句向量的余弦夹角值,以句向量和余弦距离构建承压类特种设备风险隐患风险识别分析模型输入表,记为表C。
[0040]进一步的,所述步骤S7包括以下步骤:
[0041]步骤S71、对输入表C每条输入数据获取余弦距离的数学期望,并关联设备的安装区域、使用单位基本参数和部件数据,记为表D;
[0042]步骤S72、采用基于K

medoids算法,以表D作为模型输入表,设定所述K

medoids算法中K值的取值范围,所述K值的取值范围具体为2

6,对模型输入数据中的余弦距离进行聚类,得到多个聚类细分结果表;
[0043]步骤S73、在表D添加聚类标签字段,记录每次聚类结果的类标签值;
[0044]步骤S74、获取各个聚类细分结果表的兰德系数值,兰德系数的公式如下:
[0045]RI=(TP+TN)/(TP+TN+FP+FN),其中TP是指两个同类样本点在同一类别中的情况数量,TN是指两个非同类样本点分别在两个类别中的情况数量,FP是指两个非同类样本点在同一类中的情况数量,FN是指两个同类样本点分别在两个类别中的情况数量,利用指标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种承压类特种设备安全风险分析方法,其特征在于,所述方法步骤如下:步骤S1、获取承压类特种设备bert增量预训练模型数据集;步骤S2、构建数据集的中文词汇切分表;步骤S3、运用数据集和中文词汇切分表对bert模型进行增量预训练,获得承压类特种设备的bert预训练模型;步骤S4、构建承压类特种设备检验发现隐患部件、关键词与风险分类等级规则对应的数据表;步骤S5、获取检验记录数据和设备档案数据,结合两种数据并从中提取出设备关键参数与检验不合格项数据;步骤S6、通过bert增量预训练模型计算各部件或设备整体的不合格描述的句向量,计算各不合格描述文本的余弦距离,以句向量和余弦距离构建承压类特种设备风险隐患识别分析模型输入表;步骤S7、根据所述承压类特种设备风险隐患识别分析模型输入表中的数据计算对应数据余弦距离的数学期望,关联设备和部件,然后通过K

medoids算法进行聚类,并选择出最优聚类模型;步骤S8、对比分析最优聚类模型中各类不合格描述关联的部件和关键词在风险分类等级规则表中对应的风险等级,找出存在隐患的承压类特种设备;步骤S9、读取中风险和高风险隐患承压类特种设备的信息,形成输出结果。2.根据权利要求1所述的一种承压类特种设备安全风险分析方法,其特征在于,所述步骤S1进一步具体为:步骤S11、获取承压类特种设备检验不合格项的文本描述作为bert增量预训练模型数据集。3.根据权利要求1所述的一种承压类特种设备安全风险分析方法,其特征在于,所述步骤S2进一步具体为:步骤S21、以检验发现的隐患部件为单位细分bert增量预训练模型数据集,记为表A;步骤S22、对表A进行特殊字符和数学符号的剔除;步骤S23、构建承压类特种设备检验专业词典D1;步骤S24、运用LTP分词工具,结合D1表A以词为单位进行拆分,形成分词结果表,记为A1;步骤S25、运用bert模型分词器对表A以字为单位进行拆分,形成分词结果表,记为表A2;步骤S26、将表A2拆分的字按顺序连接组成词汇,与表A1对应的数据进行比对,筛选出A2在A1词长度大于1的词,并保留词的第一个字以外的字在A2的位置序号,形成中文词汇切分表,记为表B;步骤S27、将表A的数据按比例随机分为训练集train和验证集eval;步骤S28、根据步骤S27得到的训练集train和验证集eval筛选出在表B中相应的中文词汇切分表,记为train_ref和eval_ref。4.根据权利要求3所述的一种承压类特种设备安全风险分析方法,其特征在于,所述步骤S3包括以下步骤:步骤S31、运用bert模型分词器分别对train和eval以字为单位进行拆分,并标识每个
字对应的位置序号,形成分词结果,记为C1和C2;步骤S32、C1与train_ref一一对应后进行数据合并形成最终训练集数据,记为train_end;步骤S33、C2与eval_ref一一对应后进行数据合并形成最终验证集数据,记为eval_end;步骤S34、设置训练参数,以train_end和eval_end为数据集构建增量预训练模型,进行全词掩码的掩码语言模型增量预训练,形成承压类特种设备检验领域的bert预训练模型,记为bert

pretrain模型。5.根据权利要求1所述的一种承压类特种设备安全风险分析方法,其特征在于,所述步骤S5包括以下步骤:步骤S51、过...

【专利技术属性】
技术研发人员:潘健鸿薛舒芃李伟程邹山青黄金周廖安叶琳玲詹玉巧
申请(专利权)人:福建省特种设备检验研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1