System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种用于设备检测报告的分类模型、方法和系统技术方案_技高网

一种用于设备检测报告的分类模型、方法和系统技术方案

技术编号:41232161 阅读:3 留言:0更新日期:2024-05-09 23:47
本发明专利技术涉及自然语言处理和设备损伤识别技术领域,尤其是一种用于设备检测报告的分类模型、方法和系统。本发明专利技术在模型训练过程中通过合并表示检测报告关键词的文本向量和表示损失模式识别知识的损失模式识别知识向量构建训练样本,在训练过程中充分学习标准的损失模式识别知识。本发明专利技术提出的损伤分类模型,本质上是损伤模式识别语言模型,本发明专利技术将设备标准中损伤模式识别知识和损伤检测报告语义角色标注信息分开处理,具有较高解耦性,使得损伤模式识别语言模型具有较好的迁移能力,能够适应预训练语言模型的快速升级,有利于提高模型的适用范围,大大提高了通过语言模型实现设备检测报告分类的精确性。

【技术实现步骤摘要】

本专利技术涉及自然语言处理和设备损伤识别,尤其是一种用于设备检测报告的分类模型、方法和系统


技术介绍

1、承压设备广泛使用于流程工业的贮存、输送、反应、分离等环节,往往盛装高温、高压、易燃、易爆、剧毒等特点的介质,日常巡检和安全检验是安全保障的重要组成环节。检测结果一般表现为检测报告形式,行业专家通过检测报告判断设备损伤模式和进行检测报告分类。

2、随着石化企业规模的扩展,检验检测频率增加,导致检验检测报告增加,传统的损伤模式识别和报告分类方法,一方面受人工主观因素影响,一方面受报告数量增加的影响,不可避免出现一定程度上误差。

3、随着自然语言处理技术的发展,通过自然语言模型实现文本语义分析已经逐渐成为研究热点,但是当前出现的自然语言处理模型在检测报告分类的准确度难以达到要求。


技术实现思路

1、为了克服上述现有技术中自然语言处理模型在检测报告分类的准确度难以达到要求,其他检测分类方法效率太低的缺陷,本专利技术提出了一种用于设备检测报告的分类模型,可实现设备检测报告的高精度快速分类。

2、本专利技术提出的一种用于设备检测报告的分类模型的构建方法,用于训练损伤分类模型,损伤分类模型的输入为设备检测报告的关键词,输出为设备检测报告对应的损伤类别;

3、所述损伤分类模型的构建方法为:

4、基于设备的报告文本数据集和损伤识别标准知识库构建学习样本{检测报告关键词,损伤模式识别知识向量;损伤模式};设备的损伤识别标准知识库记载有设备各损伤模式下的损伤模式识别知识;损伤识别知识包括损伤模式和损伤描述;报告文本数据集用于存储记载设备检测结果的报告文本;学习样本和报告文本一一对应,检测报告关键词为报告文本对应的关键词,损伤模式识别知识向量为预训练的语言模型对检测报告关键词对应的损伤模式识别知识的向量化表示;损伤模式为人工标注值;

5、构建基础模型,基础模型包括向量生成模块和报告分类模块;向量生成模块用于将检测报告关键词转换成文本向量;报告分类模块基于文本向量标注损伤类别;基础模型对学习样本进行学习,以训练模型参数;

6、基础模型对学习样本的学习过程中,向量生成模块将检测报告关键词转换为文本向量,报告分类模块的输入为将文本向量与损伤模式识别知识向量进行相似度合并后形成的缩减向量;报告分类模块基于缩减向量标注学习样本的损伤模式。

7、优选的,设备检测报告的关键词生成包括以下步骤:

8、s11、获取设备检测报告,对检测报告进行预处理,生成用于统计损伤识别的关键信息的报告文本;损伤识别的关键信息包括:设备状态描述、工况描述和检测结果;

9、s12、对报告文本进行语义角色标注,提取语义角色作为设备检测报告的关键词。

10、优选的,将文本向量与损伤模式识别知识向量进行相似度合并的方式为:将文本向量与损伤模式识别知识向量进行拼接,当拼接向量中属于损伤模式识别知识向量的某个语义角色与文本向量中某个语义角色的相似度大于设定的相似度阈值,则删除损伤模式识别知识向量中的该语义角色;相似度阈值在区间[0.6,0.98]上取值。

11、优选的,相似度阈值取值80%。

12、优选的,基于学习样本训练损伤分类模型,包括以下步骤:

13、s24、选择设定数量n1个学习样本作为训练样本输入损伤分类模型;向量生成模块对检测报告关键词进行向量化表示,作为文本向量;将文本向量与损伤模式识别知识向量进行相似度合并后形成缩减向量,报告分类模块基于缩减向量标注训练样本的损伤模式;损伤分类模型通过学习训练样本更新向量生成模块和报告分类模块;n1为设定值;

14、s25、选择设定数量n2个学习样本作为验证样本输入损伤分类模型;向量生成模块对检测报告关键词进行向量化表示,作为文本向量;将文本向量与损伤模式识别知识向量进行相似度合并后形成缩减向量,报告分类模块基于缩减向量标注验证样本的损伤模式记作模型标注损伤模式;n2为设定值;

15、s26、结合n2个验证样本的模型标注损伤模式和人工标注的损伤模式,计算损伤分类模型的损失;

16、s27、判断损伤分类模型是否收敛;否,则结合损失下降对损伤分类模型进行更新,然后返回步骤s24;是,则固定向量生成模块的参数和报告分类模块的参数,并输出损伤分类模型。

17、优选的,报告分类模块的输出为损伤模式概率分布,报告分类模块取最大概率对应的损伤模式作为模型标注损伤;s26中结合n2个验证样本的模型标注损伤在对应的损伤模式概率分布中的的概率值计算均方差损失。

18、优选的,向量生成模块采用bert模型,报告分类模块采用检测报告分类语言模型。

19、本专利技术提出的一种用于设备检测报告的损伤分类方法,包括以下步骤:

20、s31、采用所述的用于设备检测报告的分类模型的构建方法获取损伤分类模型;获取待分类的设备检测报告的关键词;

21、s32、向量生成模块生成所述关键词的向量化表示,作为待分类的设备检测报告的文本向量;所述文本向量输入报告分类模块;

22、s33、报告分类模块输出模型标注损伤作为损伤分类结果。

23、本专利技术提出的一种用于设备检测报告的损伤分类系统,包括存储器,存储器中存储有计算机程序,所述计算机程序被执行时用于实现所述的用于设备检测报告的分类模型的构建方法,以构建损伤分类模型。

24、本专利技术提出的一种用于设备检测报告的损伤分类系统,包括存储器和处理器,存储器中存储有计算机程序和损伤分类模型,存储器中存储有计算机程序,处理器与存储器连接,处理器用于执行所述计算机程序以实现所述的用于设备检测报告的损伤分类方法。

25、本专利技术的优点在于:

26、(1)本专利技术提出的损伤分类模型,本质上是损伤模式识别语言模型,本专利技术将设备标准中损伤模式识别知识和损伤检测报告语义角色标注信息分开处理,具有较高解耦性,使得损伤模式识别语言模型具有较好的迁移能力,能够适应预训练语言模型的快速升级,有利于提高模型的适用范围,大大提高了通过语言模型实现设备检测报告分类的精确性。

27、(2)本专利技术采用语义角色标注的方式提取关键词,进一步提高了检测报告整体处理的效率。本专利技术在模型训练过程中通过合并表示检测报告关键词的文本向量和表示损失模式识别知识的损失模式识别知识向量构建训练样本,在训练过程中充分学习标准的损失模式识别知识,从而在应用过程中可直接针对检测报告关键词进行报告分类,进一步提高了模型的准确率。

28、(3)本专利技术使用预训练语言模型对设备损伤检测报告自动分类,所训练的语言模型具有自动进行损伤模式知识分类,降低人工判断受主观因素的影响,提高了损伤模式识别的准确性。

29、(4)本专利技术专利通过检测报告历史数据建立数据集,建立报告分类模型,实现损伤模式快速识别和检测报告快速分类,可以提高报告分类效率,同时,避免人工主观因素造成的本文档来自技高网...

【技术保护点】

1.一种用于设备检测报告的分类模型的构建方法,其特征在于,用于训练损伤分类模型,损伤分类模型的输入为设备检测报告的关键词,输出为设备检测报告对应的损伤类别;

2.如权利要求1所述的用于设备检测报告的分类模型的构建方法,其特征在于,设备检测报告的关键词生成包括以下步骤:

3.如权利要求1所述的用于设备检测报告的分类模型的构建方法,其特征在于,将文本向量与损伤模式识别知识向量进行相似度合并的方式为:将文本向量与损伤模式识别知识向量进行拼接,当拼接向量中属于损伤模式识别知识向量的某个语义角色与文本向量中某个语义角色的相似度大于设定的相似度阈值,则删除损伤模式识别知识向量中的该语义角色;相似度阈值在区间[0.6,0.98]上取值。

4.如权利要求3所述的用于设备检测报告的分类模型的构建方法,其特征在于,相似度阈值取值80%。

5.如权利要求3所述的用于设备检测报告的分类模型的构建方法,其特征在于,基于学习样本训练损伤分类模型,包括以下步骤:

6.如权利要求5所述的用于设备检测报告的分类模型的构建方法,其特征在于,报告分类模块的输出为损伤模式概率分布,报告分类模块取最大概率对应的损伤模式作为模型标注损伤;S26中结合N2个验证样本的模型标注损伤在对应的损伤模式概率分布中的的概率值计算均方差损失。

7.如权利要求1所述的用于设备检测报告的分类模型的构建方法,其特征在于,向量生成模块采用BERT模型,报告分类模块采用检测报告分类语言模型。

8.一种采用如权利要求1-7任一项所述的用于设备检测报告的分类模型的构建方法的用于设备检测报告的损伤分类方法,其特征在于,包括以下步骤:

9.一种用于设备检测报告的损伤分类系统,其特征在于,包括存储器,存储器中存储有计算机程序,所述计算机程序被执行时用于实现如权利要求1-7任一项所述的用于设备检测报告的分类模型的构建方法,以构建损伤分类模型。

10.一种用于设备检测报告的损伤分类系统,其特征在于,包括存储器和处理器,存储器中存储有计算机程序和损伤分类模型,存储器中存储有计算机程序,处理器与存储器连接,处理器用于执行所述计算机程序以实现如权利要求8所述的用于设备检测报告的损伤分类方法。

...

【技术特征摘要】

1.一种用于设备检测报告的分类模型的构建方法,其特征在于,用于训练损伤分类模型,损伤分类模型的输入为设备检测报告的关键词,输出为设备检测报告对应的损伤类别;

2.如权利要求1所述的用于设备检测报告的分类模型的构建方法,其特征在于,设备检测报告的关键词生成包括以下步骤:

3.如权利要求1所述的用于设备检测报告的分类模型的构建方法,其特征在于,将文本向量与损伤模式识别知识向量进行相似度合并的方式为:将文本向量与损伤模式识别知识向量进行拼接,当拼接向量中属于损伤模式识别知识向量的某个语义角色与文本向量中某个语义角色的相似度大于设定的相似度阈值,则删除损伤模式识别知识向量中的该语义角色;相似度阈值在区间[0.6,0.98]上取值。

4.如权利要求3所述的用于设备检测报告的分类模型的构建方法,其特征在于,相似度阈值取值80%。

5.如权利要求3所述的用于设备检测报告的分类模型的构建方法,其特征在于,基于学习样本训练损伤分类模型,包括以下步骤:

6.如权利要求5所述的用于设备检测报告的分类模型的构建方法,其特征...

【专利技术属性】
技术研发人员:朱建新乔松方向荣方卓婷徐越遥亢海洲袁文彬吕宝林
申请(专利权)人:合肥通用机械研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1