当前位置: 首页 > 专利查询>扬州大学专利>正文

一种基于提示学习扩展标签词的领域自适应方法技术

技术编号:41586581 阅读:21 留言:0更新日期:2024-06-07 00:00
本发明专利技术公开了一种基于提示学习扩展标签词的领域自适应方法,1)在带有标记的源域数据上进行预训练,利用掩码语言模型学习源域数据的语言特征,随后将此模型迁移到目标域进行应用;2)通过引入外部的先验知识,利用知识图谱Probase获取每个类别y相关的多个扩展标签词,对源域和目标域的标签词空间分别进行扩展,并对得到的标签词集取交集;3)将目标域数据嵌入到提示模板中,提示学习模型预测扩展后的标签词集中每个单词的概率,将每个单词得到的预测概率映射到具体地类别标签上,并对预测的概率取平均值作为最后类别分类的依据。本发明专利技术通过利用源域的少量标注数据训练模型,来引导模型学习目标领域的有用特征,提高模型的适应性和泛化能力。

【技术实现步骤摘要】

本专利技术涉及迁移学习研究领域,特别涉及一种基于提示学习扩展标签词的领域自适应方法


技术介绍

1、传统机器学习方法的实现要求训练数据和测试数据具有相同的特征空间和数据分布。然而,在现实场景中,当不同领域的数据分布存在较大差距时,传统机器学习方法从训练数据中获得的分类器往往难以在目标领域的学习任务上取得令人满意的结果。近年来,领域自适应得到了广泛的关注和研究,主要目的是将一个在源域上训练好的模型应用于目标域,从而解决目标域缺乏标注数据或标注数据稀缺的问题。

2、深度神经网络因其显著的特征学习能力而被广泛应用于领域自适应。以往的研究已经证明了它们在这方面的功效,并取得了相当不错的效果。然而基于深度学习的领域自适应方法的实现需要使用特征提取器来生成数据混淆域鉴别器,其目的是最小化特征空间中源域和目标域之间的差异。为了最小化差异而对域进行对齐可能会导致语义信息的丢失,并且这种方法通常需要大量的标记数据来训练深度学习模型。


技术实现思路

1、本专利技术的目的是克服现有技术缺陷,提供一种基于提示学习扩展标签本文档来自技高网...

【技术保护点】

1.一种基于提示学习扩展标签词的领域自适应方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于提示学习扩展标签词的领域自适应方法,其特征在于,所述步骤1)具体包括:

3.根据权利要求1所述的一种基于提示学习扩展标签词的领域自适应方法,其特征在于,所述步骤2)具体包括:

4.根据权利要求1所述的一种基于提示学习扩展标签词的领域自适应方法,其特征在于,所述步骤3)体包括:

【技术特征摘要】

1.一种基于提示学习扩展标签词的领域自适应方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于提示学习扩展标签词的领域自适应方法,其特征在于,所述步骤1)具体包括:

3.根...

【专利技术属性】
技术研发人员:李云王书琴朱毅强继朋袁运浩
申请(专利权)人:扬州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1