跨域小样本关系抽取方法、装置及电子设备制造方法及图纸

技术编号:39068764 阅读:35 留言:0更新日期:2023-10-12 20:01
本发明专利技术提供了一种跨域小样本关系抽取方法、装置及电子设备,方法包括:对多个源域进行域采样,分别划分出一个伪可见域和一个伪不可见域;应用全局参数更新策略更新所述伪可见域的元知识;根据所述伪不可见域和更新后的所述元知识进行迁移学习操作,获取更新的可迁移知识;根据所述元知识和所述更新的可迁移知识预测目标域的关系标签。通过以上方式,本发明专利技术能够适应源域和目标域的分布差异,提高提高对未见目标域的泛化能力。见目标域的泛化能力。见目标域的泛化能力。

【技术实现步骤摘要】
跨域小样本关系抽取方法、装置及电子设备


[0001]本专利技术属于信息
,具体是涉及到一种跨域小样本关系抽取方法、装置及电子设备。

技术介绍

[0002]关系抽取(Relation Extraction,RE)的目标是预测给定上下文中两个实体之间的关系。例如,给定一个句子“London is the capital of the UK”,capital of代表关系标签,London代表头实体,the UK代表尾实体。关系抽取模型能够识别London和UK之间的关系是capital of。关系抽取是自然语言处理任务的基石,为智能检索、语义分析以及自动问答等下游任务提供了基础支持。
[0003]传统基于核函数、基于特征向量以及基于神经网络的关系抽取方法需要大量的标注数据进行训练,很难推广到现实应用场景。此外,不断增加的新关系和实体很容易也使关系抽取模型面临着数据稀缺的难题。基于以上问题,提出利用元学习(metadata learning,ML)来引导模型利用过去所学知识快速学习新概念。具体来说,ML模型首先构造了一系列具有丰富标注的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种跨域小样本关系抽取方法,其特征是,所述跨域小样本关系抽取方法包括:对多个源域进行域采样,分别划分出一个伪可见域和一个伪不可见域;应用全局参数更新策略更新所述伪可见域的元知识;根据所述伪不可见域和更新后的所述元知识进行迁移学习操作,获取更新的可迁移知识;根据所述元知识和所述更新的可迁移知识预测目标域的关系标签。2.如权利要求1所述的跨域小样本关系抽取方法,其特征是,所述对多个源域进行域采样,分别划分出一个伪可见域和一个伪不可见域,包括:对多个源域进行域采样,并从中随机选择两个候选域;对两个所述候选域进行域采样,分别划分出一个伪可见域和一个伪不可见域。3.如权利要求1所述的跨域小样本关系抽取方法,其特征是,所述应用全局参数更新策略更新所述伪可见域的元知识,包括:对所述伪可见域和所述伪不可见域进行标签级元任务采样,构建标签级元任务,所述标签级元任务包括伪可见元任务和伪不可见元任务;根据所述伪可见元任务应用关系抽取模型对所述伪可见域的元知识进行更新。4.如权利要求3所述的跨域小样本关系抽取方法,其特征是,所述伪可见元任务包括支持集和查询集,所述根据所述伪可见元任务应用关系抽取模型对所述伪不可见域的元知识进行更新,包括:应用所述关系抽取模型中的编码器将所述伪可见元任务中的支持集实例和查询集实例映射到低维向量空间;应用所述关系抽取模型中的度量函数获取所述伪可见元任务中的支持集实例和查询集实例在低维向量空间的表示,预测所述伪可见元任务中的查询集实例的关系标签;根据预测的所述查询集实例的关系标签计算所述关系抽取模型的交叉熵损失函数;根据所述交叉熵损失函数对所述元知识进行更新。5.如权利要求1所述的跨域小样本关系抽取方法,其特征是,所述伪不可见元任务包括支持集和查询集,所述根据所述伪不可见域和更新后的所述元知识进行迁移学习操作,获取更新的可迁移知识,包括:根据更新后的所述元知识分为权重参数和偏差参数;基于前馈神经网络对所述权重参数和所述偏差参数进行迁移...

【专利技术属性】
技术研发人员:陈洪辉王梦如蔡飞郑建明张梦溪郭昱普邵太华江苗王祎童
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1