【技术实现步骤摘要】
基于双重注意力机制的面向大坝应急工况事件抽取方法
[0001]本专利技术涉及一种基于双重注意力机制的面向大坝应急工况事件抽取方法,属于自然语言处理
技术介绍
[0002]在水利工程领域,大坝集防洪、蓄水、发电等功能于一身,在其长周期运行过程中,会遇到很多自然风险事件,如地震、洪水、暴雨等事件。在这些特殊事件发生后,全面地专项检查对大坝维护来说至关重要,此外,大坝的日常检查与检修也是保障大坝安全的重要措施。历年来,大坝应急工况下的安全运行记录会产出繁多的专项检查报告和日常巡检报告,报告都相对冗长,如何从这些大量的非结构化的文本数据中挖掘出有使用价值的信息,仍是一个难题。信息抽取研究正是这种背景下应运而生的,事件抽取是信息抽取研究中最具挑战性的任务之一。在信息时代的背景下,单纯依靠手工劳动来识别事件论元并整理成结构化数据费时又费力,因此大坝应急工况事件的自动抽取具有重要的意义。
[0003]我们在事件抽取的研究中发现,现有的卷积神经网络和递归神经网络等深度学习网络已被用于生成低维向量,以自动表示文本语义信息,并 ...
【技术保护点】
【技术特征摘要】
1.一种基于双重注意力机制的面向大坝应急工况事件抽取方法,其特征在于,基于图转换注意网络和注意力网络来挖掘句法关系,对大坝应急工况语料库进行事件论元角色抽取和填充,包括以下步骤:(1)数据预处理:包括对大坝应急工况语料库的标记处理以及将包含大坝应急工况事件信息的句子和文档进行编码;(2)构建依赖关系图:引入依赖关系,借助句子结构和语义结构构建依赖关系图,以识别和分类大坝应急工况事件的所有参数;(3)构建双重注意力网络:基于图转换注意网络生成新的依赖弧,并聚合节点信息,捕获长程依赖关系和潜在交互;然后,引入注意力网络,将图转换注意网络层和注意力网络层提取的特征按设定比例融合,捕捉句中关键的语义信息,抽取句子级事件论元;(4)文档级论元填充:检测大坝应急工况文档中具备关键事件的句子,利用孪生神经网络将周围句子中相似度最高的论元角色填充到关键事件缺失的部分。2.根据权利要求1所述的基于双重注意力机制的面向大坝应急工况事件抽取方法,其特征在于,所述大坝应急工况语料库包括大坝历年专项检查报告和日常巡检报告。3.根据权利要求1所述的基于双重注意力机制的面向大坝应急工况事件抽取方法,其特征在于,所述步骤(1)中数据预处理的具体步骤如下:采用BIO模式将大坝专项检查报告和日常巡检报告的数据进行标注;用ALBERT模型最后一层312维向量作为词嵌入向量,串联事件类型嵌入向量、实体类型嵌入向量和词性标注嵌入向量;通过双向长短记忆网络挖掘串联后的嵌入向量,得到隐藏向量H=h1,...,h
n
。4.根据权利要求1所述的基于双重注意力机制的面向大坝应急工况事件抽取方法,其特征在于,所述步骤(2)中构建依赖关系图的具体步骤如下:根据大坝应急工况语料库中的单词关系构建依赖树的邻接矩阵A
d
和依赖标签分数矩阵通过计算步骤(1)获得的隐藏向量h
i
和h
j
之间分数得到语义分数矩阵A
s
;将A
d
、A
s
串联得到依赖关系图矩阵5.根据权利要求1所述的基于双重注意力机制的面向大坝应急工况事件抽取方法,其特征在于,所述步骤(3)中构建双重注意力网络的具体步骤如下:提出图转换注意网络,将图卷积网络替换为图注意网络,进行合理的权重分配;图转换注意网络通过图转换器层对邻接矩阵A集合采用1
×
...
【专利技术属性】
技术研发人员:程永,毛莺池,肖海斌,詹维勇,陈豪,王龙宝,赵富刚,方晗,周晓峰,张春锐,谭彬,谢文明,聂斌斌,陈智祥,杨春睿,
申请(专利权)人:华能澜沧江水电股份有限公司华能集团技术创新中心有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。