一种基于随机投影度量空间的小样本分类方法及装置制造方法及图纸

技术编号：36606087 阅读：23 留言：0更新日期：2023-02-04 18:28

本发明专利技术公开了一种基于随机投影度量空间的小样本分类方法及装置，涉及自然语言处理技术领域。包括：获取待分类的多个任务；将多个任务输入到基于随机投影度量空间的分类模型；根据多个任务以及基于随机投影度量空间的分类模型，得到多个任务的分类结果。本发明专利技术构建适应具体任务的随机度量空间，通过微调样本向量在度量空间中的位置来构建基于任务特征的度量空间，具体的使用随机向量来学习每个任务的度量空间，从而解决一般做法中通用的度量空间不能很好地适用于所有任务，缺乏适用性这一问题。题。题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于随机投影度量空间的小样本分类方法及装置

[0001]本专利技术涉及自然语言处理
，特别是指一种基于随机投影度量空间的小样本分类方法及装置。

技术介绍

[0002]小样本学习能够利用少量的数据进行学习，因此能够运用到许多缺乏充足标签数据的领域中(Chen et al.,2019；Wang et al.,2020；Garcia and Bruna,2017)。在自然语言处理研究中，小样本学习已经成为了一个火热的课题。小样本学习的技术运用在了自然语言处理中的各个领域，对于文本分类，小样本学习(Yu et al.,2018；Geng et al.,2019；Bao et al.,2019)能够在少量的带标签数据上进行学习并迁移到新的分类任务中。
[0003]目前已有不少学者针对小样本学习研究领域中出现的众多难点提出了解决方案。针对小样本文本分类任务的多样性以及样本中可能存在的噪音，Gao T等人(Gao et al.,2019)利用层级注意力来处理，从而提高了模型的鲁棒性。Obamuyide等人(Obamuyide and Vlachos,2019)将有监督分类问题作为元学习的一个例子，从而提出了与模型无关的元学习方案。Xie等人(Xie et al.,2020)利用异构图网络与对抗训练减少模型对噪声样本的敏感性。
[0004]基于度量的元学习方法通过学习度量空间以及使用距离空间来预测标签。一般来说，元学习需要在多个任务上进行训练，并且统一地将这些子任务投影到同一个度量空间中(Vinyals e...

【技术保护点】

【技术特征摘要】
1.一种基于随机投影度量空间的小样本分类方法，其特征在于，所述方法包括：S1、获取待分类的多个任务；S2、将所述多个任务输入到基于随机投影度量空间的分类模型；S3、根据所述多个任务以及所述基于随机投影度量空间的分类模型，得到多个任务的分类结果。2.根据权利要求1所述的方法，其特征在于，所述S3中的根据所述多个任务以及所述基于随机投影度量空间的分类模型，得到多个任务的分类结果包括：S31、获取多个任务中每个任务的支撑集以及查询集；S32、根据所述基于随机投影度量空间的分类模型的嵌入层，对所述支撑集以及查询集进行特征提取，得到支撑集以及查询集的特征信息；S33、分别对每个任务构造度量空间；S34、基于每个任务的度量空间、所述支撑集以及查询集的特征信息，得到多个任务的分类结果。3.根据权利要求2所述的方法，其特征在于，所述S33中的分别对每个任务构造度量空间包括：分别对每个任务进行随机向量投影学习，得到每个任务的度量空间。4.根据权利要求3所述的方法，其特征在于，所述对每个任务进行随机向量投影学习包括：S331、采用两个独立的单层感知机，根据随机向量，分别生成参数γ
predict
和β
predict
；S332、判断每个任务的特征与现有任务的特征的差距是否超过阈值；若是，则对所述任务中的样本特征进行修改；S333、利用权重生成器，根据随机向量，生成归一化的参数γ
predict
和β
predict
。5.根据权利要求4所述的方法，其特征在于，所述S331中的参数γ
predict
和β
predict
，如下式(1)(2)所示：式(1)(2)所示：其中，
△
γ
predict
为调整前的归一化参数，c为随机向量；为单层感知机。6.根据权利要求5所述的方法，其特征在于，S332中的所述对所述任务中的样本特征进行修改，如下...

【专利技术属性】
技术研发人员：刘鹏远，胡晗，吴艺，于东，黄文源，
申请(专利权)人：北京语言大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人