当前位置: 首页 > 专利查询>扬州大学专利>正文

一种创新的跨领域自适应提示学习方法技术

技术编号:42492164 阅读:26 留言:0更新日期:2024-08-21 13:09
本发明专利技术公开了一种创新的跨领域自适应提示学习方法,包括1)在带有标记的源域数据上进行预训练,使用掩码语言模型来学习源域数据的语言特征,将该模型应用于目标域;2)利用微调后的模型在源域进行同义词检索,并在目标域结合FastText相似、概率预测和上下文信息策略对标签词进行扩展;通过取源域和目标域扩展的标签词之间的交集来构建最终的标签词;3)将目标域数据嵌入到提示模板中,使得提示学习模型能够预测扩展后的标签词集中每个单词的概率;将每个单词的预测概率映射到具体的类别标签上,并对预测的概率取平均值,作为最终分类预测目标域数据的依据。本发明专利技术实现了对目标域数据的准确分类预测,提高了模型在跨领域分类任务中的性能。

【技术实现步骤摘要】

本专利技术涉及迁移学习研究领域,特别涉及一种创新的跨领域自适应提示学习方法


技术介绍

1、传统机器学习方法通常侧重于通过对源域和目标域数据的具有相同的特征空间和数据分布来减小领域之间的分布差异。这些方法主要包括特征选择、特征映射、实例重标定等技术。其中,特征选择通过选择对于目标领域任务有用的特征来降低维度,以期提高模型的泛化性。特征映射则试图通过将源域特征映射到目标域来减小领域之间的差异。实例重标定通过对源域和目标域的样本进行重标定,使它们在特征空间中更为接近。然而,这些方法的性能受到领域差异复杂性的限制,在现实场景中,当不同领域的数据分布存在较大差距时,传统机器学习方法从训练数据中获得的分类器往往难以在目标领域的学习任务上取得令人满意的结果。

2、近年来,领域自适应得到了广泛的关注和研究,主要目的是将一个在源域上训练好的模型应用于目标域,从而解决目标域缺乏标注数据或标注数据稀缺的问题。然而基于深度学习的方法通常需要大量标注的源域数据和相应目标域的标签,以进行训练。这可能涉及到对大规模数据集的深度神经网络的训练,需要相对较高的计算资源和标注成本文档来自技高网...

【技术保护点】

1.一种创新的跨领域自适应提示学习方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种创新的跨领域自适应提示学习方法,其特征在于,所述步骤1)具体包括:

3.根据权利要求1所述的一种创新的跨领域自适应提示学习方法,其特征在于,所述步骤2)具体包括:

4.根据权利要求1所述的一种创新的跨领域自适应提示学习方法,其特征在于,所述步骤2.2)具体包括:

5.根据权利要求1所述的一种创新的跨领域自适应提示学习方法,其特征在于,所述步骤3)具体包括:

【技术特征摘要】

1.一种创新的跨领域自适应提示学习方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种创新的跨领域自适应提示学习方法,其特征在于,所述步骤1)具体包括:

3.根据权利要求1所述的一种创新的跨领域自适应提示学习方法,其特...

【专利技术属性】
技术研发人员:李云王书琴朱毅强继朋袁运浩
申请(专利权)人:扬州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1