基于自适应少样本关系抽取的知识图谱构建方法技术

技术编号:29673621 阅读:26 留言:0更新日期:2021-08-13 21:55
本发明专利技术公开了基于自适应少样本关系抽取的知识图谱构建方法,该抽取方法包括实体间关系采用自适应关系抽取模型提取,所述自适应关系抽取模型的构建包括:S100:利用文本编码器对训练集实例进行编码,生成上下文关系语义;S200:将支持集输入参数生成器,生成初始化softmax参数;S300:将步骤S100生成的上下文关系语义输入自适应图神经网络,利用自适应图神经网络对实例进行更新;S400:利用softmax分类器对更新后的实例进行分类预测,获取关系类型。本发明专利技术在获取关系时不需要大量的人工标注数据,避免了大量的人工打标带来的费时耗钱,且通过少量特定领域的标签数据就可以完成特定领域的关系抽取任务。

【技术实现步骤摘要】
基于自适应少样本关系抽取的知识图谱构建方法
本专利技术属于自然语言处理领域,具体涉及基于自适应少样本关系抽取的知识图谱构建方法。
技术介绍
知识图谱又称科学知识图谱,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。现有技术中,面向通用领域的知识图谱构建是利用原始的非结构化文本来形成知识图谱,主要包括步骤:(1)抽取实体,即从非结构化文本中自动识别实体;(2)抽取关系,即识别实体间的关系;(3)实体链接,即对抽取的实体及关系数据进行逻辑归属和消除冗余;(4)知识推理,即根据事实三元组自动推理出关系值缺失,进行知识图谱的补全。上述步骤(1)和(2)均涉及信息抽取技术,信息抽取是自然语言处理中的重要组成部分,特别是在当今信息化社会中,从海量数据中抽取出有用的信息显得格外有意义。信息抽取可以分为实体抽取、关系抽取和事件抽取等。关系抽取任务一般形式是给定文本及文本中涉及的两个实体,判定实体之间是否存在关系以及存在何种关系。关系抽取不但是知识图谱构建中的重要本文档来自技高网...

【技术保护点】
1.基于自适应少样本关系抽取的知识图谱构建方法,包括从获取的非结构化文本中自动提取实体及实体间关系、基于提取的实体及关系数据进行实体链接、以及进行知识图谱的补全;其特征是:/n实体间关系采用自适应关系抽取模型提取,自适应关系抽取模型的构建如下:/n给定训练集,其包含

【技术特征摘要】
1.基于自适应少样本关系抽取的知识图谱构建方法,包括从获取的非结构化文本中自动提取实体及实体间关系、基于提取的实体及关系数据进行实体链接、以及进行知识图谱的补全;其特征是:
实体间关系采用自适应关系抽取模型提取,自适应关系抽取模型的构建如下:
给定训练集,其包含M个类别,每个类别下有N个实例,每个实例包括句子以及句子的头实体、尾实体;从训练集中随机抽取个类别,从每个类别中随机抽取K个实例,构造支持集,,;从每个类别剩余的N-K个样本中随机抽取L个实例构造查询集;
S100:利用文本编码器对训练集实例进行编码,生成上下文关系语义;
S200:将支持集输入参数生成器,生成初始化softmax参数;
S300:将步骤S100生成的上下文关系语义输入自适应图神经网络,利用自适应图神经网络对实例进行更新;所述自适应图神经网络的构建如下:
S310:构建点图,其中节点表示一实例的特征向量,边描述实例之间的相似关系;
S320:构建分布图,其中节点表示一实例的分布,边描述分布与分布之间的相似关系;所述分布指一实例与其他所有实例的相似关系构成的向量;
S330:将支持集和查询集中实例的上下文关系语义作为特征向量,用来初始化点图的节点,利用节点间的相似关系初始化点图相应的边;
S340:利用支持集和查询集中各实例的相似关系向量初始化分布图的节点,利用节点间的相似关系初始化分布图相应的边;
相似关系向量,也即分布图中第i个节点;||表示,级联操作,和分别表示实例i和实例j的关系类别标签,如果,则,否则;
S350:将点图中各节点间的相似关系和上一层分布图中该节点聚合,作为更新后的分布图节点,同时更新分布图的边;
S350:将更新后分布图中每个节点间的相似关系和行一层点图中对应节点聚合,作为更新后点图节点,同时更新点图...

【专利技术属性】
技术研发人员:孙喜民周晶毕立伟李晓明王帅孙博郑斌刘丹常江
申请(专利权)人:国网电子商务有限公司国网电商科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1