面向电力设备的实体关系抽取方法及相关装置制造方法及图纸

技术编号:37334317 阅读:23 留言:0更新日期:2023-04-21 23:12
本申请提供一种面向电力设备的实体关系抽取方法及相关装置,涉及自然语言处理技术领域。该方法包括:获取描述电力设备的文本信息;从文本信息中提取出待处理句子;对待处理句子的字符进行特征提取,得到字符特征;对待处理句子的部首进行特征提取,得到部首特征;对字符特征和部首特征进行特征融合,得到融合特征;将融合特征输入实体关系提取网络,得到从待处理句子中抽取的实体关系。本申请实施例中,能够从待处理句子中提取出不同层次的特征,即字符特征和部首特征。由于部首特征能够传递语义信息,将部首特征和字符特征进行融合能够缩短不同电力设备的实体之间的距离,进而准确的提取出实体关系,且该方法在不同的电力设备之间具有泛化能力。设备之间具有泛化能力。设备之间具有泛化能力。

【技术实现步骤摘要】
面向电力设备的实体关系抽取方法及相关装置


[0001]本申请涉及自然语言处理
,具体涉及一种面向电力设备的实体关系抽取方法及相关装置。

技术介绍

[0002]随着数字化经济的发展,数字电网、智慧电网的建设成为了电力能源领域的关键。一方面,进入数字化转型的深水区,亟需自主可控的人工智能技术进行理论和技术支撑,为打通信息渠道,对重要电力设备相关舆情和发展方向进行态势感知,及时进行风向预警和生产调整工作。另一方面,要想完成智慧电网的建设,需要将全流程相关的数据提取为知识,知识凝练为智慧。其中,实体关系抽取(Entity Relation Extraction)作为一种信息抽取技术,是将信息转换为知识的关键理论技术之一。
[0003]然而,电力设备领域中,实体名称长、跨度大、专业领域词汇多。因此面向电力设备如何抽取实体关系,成为难点。

技术实现思路

[0004]鉴于现有技术中的上述缺陷或不足,本申请旨在提供一种面向电力设备的实体关系抽取方法及相关装置,可以准确的提取电力设备相关的实体关系。
[0005]第一方面,本本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种面向电力设备的实体关系抽取方法,其特征在于,所述方法包括:获取描述电力设备的文本信息;从所述文本信息中提取出待处理句子;对所述待处理句子的字符进行特征提取,得到字符特征;对所述待处理句子的部首进行特征提取,得到部首特征;对所述字符特征和所述部首特征进行特征融合,得到融合特征;将所述融合特征输入实体关系提取网络,得到从所述待处理句子中抽取的实体关系。2.根据权利要求1所述的方法,其特征在于,所述对所述待处理句子的字符进行特征提取,得到字符特征,包括:对所述待处理句子按照中文字符分割,得到字符序列;将所述字符序列输入第一自然语言特征提取模型,得到所述待处理句子的字符特征。3.根据权利要求1所述的方法,其特征在于,所述对所述待处理句子的部首进行特征提取,得到部首特征,包括:提取所述待处理句子包含的中文部首,得到部首序列;将所述部首序列输入第二自然语言特征提取模型,得到所述待处理句子的部首特征。4.根据权利要求1所述的方法,其特征在于,所述对所述字符特征和所述部首特征进行特征融合,得到融合特征之前,还包括:去除所述字符特征中的噪声信息。5.根据权利要求4所述的方法,其特征在于,所述去除所述字符特征中的噪声信息,包括:将所述字符特征输入文本去噪声模型,得到所述待处理句子中每个字符的标注类型,其中,供选择的标注类型来源于类型集合,所述类型集合包括以下标注类型:与电力设备相关、与电力设备无关;按在所述待处理句子中的位置顺序,拼接各字符的标注类型,得到标注序列;基于转换函数将所述标注序列中的每个标注类型转换为数字量,得到去重噪声后的注意力向量;其中,所述转换函数用于增强与电力设备相关的特征,并减弱与电力设备无关的特征;将所述注意力向量和所述字符特征相乘,得到去除噪声的字符特征。6.根据权利要求1

6中任一项所述的方法,其特征在于,所述实体关系抽取网络包括主体位置预测模块、以及关系预测模块,所述将所述融合特征输入实体关系提取网络,得到从所述待处理句子中抽取的实体关系,包括:将所述融合特征输入所述主体位置预测模块,得到主体的开始位置和结束位置;将所述融合特征、所述主体的开始位置和结束位置输入所述关系预测模块,得到所述关系预测模块输出...

【专利技术属性】
技术研发人员:吴佳骆晓雪王建新南智斐刘振华李坚杨峰孔庆宇于军亮
申请(专利权)人:国网智能电网研究院有限公司国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1