System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于电厂设备缺陷辅助消除领域,具体涉及一种基于孪生神经网络的电厂设备缺陷辅助消除方法及系统。
技术介绍
1、电厂文本数据蕴含丰富的领域知识和经验知识,在设备缺陷消除方面,领域知识涉及设备专业知识,经验知识主要由历史缺陷记录体现,如何从各类数据中获取规范化的信息,对多源异构数据进行有效的关联整合,并利用各类知识信息辅助电厂设备消缺流程,是实现电厂缺陷知识管理、消缺智能化的关键。
2、知识图谱是由google公司在2012年提出的概念,旨在提升搜索引擎的智能化和效率。近年来知识图谱在包括电力在内的多个行业得到了应用。电厂在生产工作过程中会产生大量设备缺陷记录、人员工作记录等非结构化和结构化数据,但是这些数据的利用效率往往较低,而通过知识图谱将历史数据以知识的方式建立关系能充分发挥它们的作用,更好地辅助电厂工作人员进行电厂知识查询、推理和缺陷消除。
3、随着自然语言处理技术的发展,基于语义的推理和检索效果也在不断提升。word2vec和glove是最常用的词向量模型,文本语义向量可通过平均文本中每个词的词向量获得,基于此可以计算文本之间的相似度,但是此类方法忽略了词的多义性以及词语在文本中的顺序和上下文;近年来通用领域预训练语言模型如bert的出现,令自然语言处理在各项文本信息抽取任务中的表现得到了显著提升,但电厂领域文本记录数据中涉及大量专业词汇和设备名称,因此直接采用通用领域bert生成的语义向量计算电厂设备缺陷描述文本间相似度的准确率并不高,因此本专利技术基于在电厂设备缺陷文本语料库中训练的孪生
技术实现思路
1、为解决现有技术中存在的不足,本专利技术提供一种基于孪生神经网络模型的电厂设备缺陷辅助消除方法及系统,利用孪生神经网络模型siamese-bert计算设备缺陷描述文本的语义特征,并通过语义特征计算缺陷描述文本间的相似度,进而为突发缺陷推荐消缺班组和消缺流程提供准确的关联信息,解决了现有技术中计算电厂设备缺陷描述文本间相似度的准确率低的问题。
2、本专利技术采用如下的技术方案。
3、本专利技术提供了一种基于孪生神经网络模型的电厂设备缺陷辅助消除方法,包括:步骤一,设计电厂设备缺陷知识图谱模式层,定义核心实体类型及关联模式;步骤二,基于历史缺陷数据和设备数据搭建电厂领域词典,通过自然语言处理工具jieba结合自定义的电厂领域词典的方法识别电厂缺陷相关数据中的实体;
4、步骤三,构建实体关系语料库,对bert模型进行微调;
5、步骤四,对于非结构化缺陷文本中的关系,利用训练后的bert模型进行识别,对于结构化数据采用直接映射抽取实体关系,将抽取和识别的实体及关系根据步骤一设计的模式层以“设备-历史缺陷-发现班组-消缺班组-分配步骤”为核心脉络映射至图数据库neo4j;
6、步骤五,构造并训练孪生神经网络模型siamese-bert;
7、步骤六,输入突发缺陷的文本描述,利用训练后的siamese-bert模型计算突发缺陷文本描述的语义特征,以及图谱中历史缺陷的隐含设备和故障信息的语义特征,计算两个语义特征间的余弦相似度,获得两者的语义相似度,依据语义相似度对历史缺陷进行排序,筛选出与突发缺陷语义相似度最高的前十个历史缺陷;
8、步骤七,利用jieba工具提取突发缺陷文本描述中的实体信息,依次在语义相似度最高的十个历史缺陷中进行检索,若在第一个的历史缺陷中检索到相同的实体信息,则停止检索;若未检索到,则对下一个历史缺陷进行检索,重复操作至将十个历史缺陷检索完成;
9、步骤八,若前十个相似历史缺陷中检索到与突发缺陷实体信息一致的相似历史缺陷,则推荐该相似历史缺陷关联的消缺班组,自动生成消缺流程;若未检索到,则推荐语义相似度最高的相似历史缺陷关联的消缺班组,消缺班组根据自动生成或人工辅助生成的消缺方案完成突发缺陷的处理后,形成突发缺陷的消缺记录。
10、优选的,所述步骤一中核心实体类型包括:设备、历史缺陷、班组、分配步骤;
11、关联模式包括:“设备-历史缺陷”、“历史缺陷-发现班组”、“历史缺陷-消缺班组”、“历史缺陷-分配步骤”以及“人员-班组”。
12、优选的,所述步骤二中缺陷数据包括:缺陷单编号,缺陷名称,缺陷描述,缺陷单填写人信息,缺陷发现人、通知人、被通知人与处理人信息,缺陷分类,消缺情况。
13、优选的,所述步骤三包括:
14、语料库由实体对、实体对之间的关系类型以及缺陷文本构成,按照3:1:1的比例将语料划分训练集、验证集和测试集,根据实体对、实体对之间的关系类型以及缺陷文本构成的语料库训练得到缺陷文本、头实体和尾实体的特征向量,对bert模型进行微调,使其对实体间的关系进行分类。
15、优选的,结构化缺陷文本格式为头实体-实体对之间的关系类型-尾实体,头实体与尾实体构成实体对。
16、优选的,所述对实体间的关系进行分类,包括:
17、模型经过微调bert模型时添加的全连接层的第一层后最终的输出公式为:
18、h′cls=w0[tanh(h0)]+b0 (1)
19、
20、
21、其中h′cls、h′e1、h′e2表示[cls]、头实体、尾实体经过全连接层后得到的特征向量,其中[cls]表示缺陷文本的特征向量;tanh为激活函数,w0、w1、w2分别表示[cls]的权重向量、头实体的权重向量、尾实体的权重向量,b0、b1、b2为相对应的偏置向量;i、j表示头实体在文本中的开始位置与结束位置;l、m表示尾实体的开始位置和结束位置;ht表示文本中第t个字的特征向量;
22、将得到的特征向量进行拼接,得到待分类的实体对特征向量hr=[h′cls,h′e1,h′e2],通过第二层全连接层和softmax函数计算hr向量所属关系类型的概率分布p(y|hr,θ),再取概率值最大的关系作为两个实体间的关系:
23、
24、其中,y为各类实体关系,θ为待学习的参数,包含偏置b和权重矩阵w其中n为关系类型的数量,d为bert输出的特征向量的维数,采用交叉熵作为模型训练时的损失函数。
25、优选的,siamese-bert模型的训练流程为:首先基于历史缺陷数据构造数据集,数据集由带标签的缺陷对构成,标签为0和1,0表示两个缺陷描述的实际不为同一种缺陷,1表示两个缺陷描述的实际为同一种缺陷;使用bert模型分别对这两个缺陷描述文本中所有字符的输出向量进行池化,得到两个缺陷描述文本语义表示u和v,该缺陷文本对相似的概率:
26、o=softmax(wt[u,v,|u-v|]) (5)
27、其中,待训练的权重参数n本文档来自技高网...
【技术保护点】
1.一种基于孪生神经网络模型的电厂设备缺陷辅助消除方法,包括:
2.根据权利要求1所述的基于孪生神经网络的电厂设备缺陷辅助消除方法,其特征在于:
3.根据权利要求1所述的基于孪生神经网络的电厂设备缺陷辅助消除方法,其特征在于:
4.根据权利要求1所述的基于孪生神经网络的电厂设备缺陷辅助消除方法,其特征在于:
5.根据权利要求4所述的基于孪生神经网络的电厂设备缺陷辅助消除方法,其特征在于:
6.根据权利要求5所述的基于孪生神经网络的电厂设备缺陷辅助消除方法,其特征在于:
7.根据权利要求6所述的基于孪生神经网络的电厂设备缺陷辅助消除方法,其特征在于:
8.一种基于孪生神经网络的电厂设备缺陷辅助消除系统,所述基于孪生神经网络的电厂设备缺陷辅助消除系统为前述权利要求1-7中所述的基于孪生神经网络的电厂设备缺陷辅助消除方法所使用的系统,包括:
9.一种终端,包括处理器及存储介质;其特征在于:
10.计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要
...【技术特征摘要】
1.一种基于孪生神经网络模型的电厂设备缺陷辅助消除方法,包括:
2.根据权利要求1所述的基于孪生神经网络的电厂设备缺陷辅助消除方法,其特征在于:
3.根据权利要求1所述的基于孪生神经网络的电厂设备缺陷辅助消除方法,其特征在于:
4.根据权利要求1所述的基于孪生神经网络的电厂设备缺陷辅助消除方法,其特征在于:
5.根据权利要求4所述的基于孪生神经网络的电厂设备缺陷辅助消除方法,其特征在于:
6.根据权利要求5所述的基于孪生神经网络的电厂设备缺陷辅助消...
【专利技术属性】
技术研发人员:谢黎,范小兵,杜辉,谭小元,米路中,李锐,贾顺杰,李洋,张艳萍,王骞,胡岿,杨孝锐,夏晶,
申请(专利权)人:国能长源随州发电有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。