【技术实现步骤摘要】
本专利技术涉及多模态信息抽取,具体涉及一种基于深度神经网络的电力设备命名实体识别方法及装置。
技术介绍
1、随着近年来信息技术的高速发展和大量企业将数字化转型作为发展的重心,数字电网、智慧电网的建设成为了中国电力能源领域进行数字赋能,进一步产生经济及社会效益的关键。一方面,进入数字化转型的深水区,需要自动化的人工智能技术进行技术及理论支持,为打通信息渠道,对重要电力设备相关的舆情信息和发展方向进行实时监测,从而辅助相关机构及时进行舆情风向预警和调整生产工作。另一方面,建设智慧电网需要将全流程相关的非结构化的数据提取为知识,知识凝练为智慧,命名实体识别(named entityrecognition)作为信息抽取技术最为基础和核心的任务,是将信息转换为知识的关键理论技术之一。因此,针对电力设备新闻报道领域特点,改进命名实体识别模型对助力智慧电网建设,为相关的监管决策提供有力支持具有重要的意义。
2、当前命名实体识别的方法主要包括基于规则的方法与基于统计机器学习的方法。早期的命名实体识别方法主要包括基于规则的方法和基于人工特征的
...【技术保护点】
1.一种基于深度神经网络的电力设备命名实体识别方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,训练所述预先构建的多模态命名实体识别模型的过程包括:
3.如权利要求2所述的方法,其特征在于,所述采用BIO标注方式对所述文本数据进行标注,得到电力设备新闻报道的命名实体识别结果,包括:
4.如权利要求2所述的方法,其特征在于,所述初始多模态命名实体识别模型包括:依次连接的BERT模型和CRF解码器,以及与BERT模型连接的分层视觉特征提取模型。
5.如权利要求4所述的方法,其特征在于,所述分层视觉特征
...【技术特征摘要】
1.一种基于深度神经网络的电力设备命名实体识别方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,训练所述预先构建的多模态命名实体识别模型的过程包括:
3.如权利要求2所述的方法,其特征在于,所述采用bio标注方式对所述文本数据进行标注,得到电力设备新闻报道的命名实体识别结果,包括:
4.如权利要求2所述的方法,其特征在于,所述初始多模态命名实体识别模型包括:依次连接的bert模型和crf解码器,以及与bert模型连接的分层视觉特征提取模型。
5.如权利要求4所述的方法,其特征在于,所述分层视觉特征提取模型,用于对所述图像数据进行特征提取,得到bert模型各层transformer对应的视觉特征;
6.如权利要求5所述的方法,其特征在于,所述分层视觉特征提取模型包括依次连接的resnet模块、缩放特征生成模块和bert模型中各transformer层对应的动态门。
7.如权利要求6所述的方法,其特征在于,所述resnet模块由4个残差网络块组成,用于生成图像数据对应的多尺度金字塔视觉特征图。
8.如权利要求7所述的方法,其特征在于,所述缩放特征生成模块具体用于:
9.如权利要求6所述的方法,其特征在于,所述bert模型中各transformer层对应的动态门具体用于:
10.如权利要求5所述的方法,其特征在于,所述bert模型由依次连接的12个transformer组成,其中,第1层transformer的输入为所述文本数据对应的初始上下文向量,第12层transformer的输出为所述融合特征,并将所述融合特征作为crf解码器的输入,各层transformer进行特征融合的过程中,将bert模型中第l层transformer对应的视觉特征与bert模型中第l层transformer中的关键字向量拼接,将bert模型中第l层transformer对应的视觉特征与bert模型中第l层transformer中的值向量拼接,l∈(1,l),l为bert模型中transformer的总数量。
11.如权利要求10所述的方法,其特征在于,所述文本数据对应的初始上下文向量的获取过程包括:
12.一种基于深度神经网络的电力设备命名实体识别装置,其特征在于,所述装置包括:
...
【专利技术属性】
技术研发人员:张强,张峰达,周飞,赵常威,宋博川,范晓宣,
申请(专利权)人:国网智能电网研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。