用于小样本意图识别的完型填空式的数据增强方法技术

技术编号：35908780 阅读：18 留言：0更新日期：2022-12-10 10:47

本申请中一个或多个实施例提供了一种用于小样本意图识别的完型填空式的数据增强方法，内容包括：基于预训练语言模型构建完型填空式的数据增强任务用于意图识别，先采用无监督学习方法使得数据增强的结果在语义上与原始输入句子相似，然后再基于度量分类采用有监督的对比学习方法，使得同一类别的意图样本在嵌入空间中更接近彼此，不同类别的意图样本更远离彼此，对比学习方法包括原型层面的对比学习和实例层面的对比学习。在不破坏句法结构和增加噪音的情况下产生有意义的数据，充分利用了有限的数据并获得可分离的嵌入。在嵌入空间中获得更好的距离分布，从而改善基于度量的分类方法的性能。类方法的性能。类方法的性能。

全部详细技术资料下载

【技术实现步骤摘要】
用于小样本意图识别的完型填空式的数据增强方法

[0001]本专利技术属于意图识别
，具体涉及一种用于小样本意图识别的完型填空式的数据增强方法。

技术介绍

[0002]意图识别旨在从用户的话语中识别出用户的潜在意图，这是面向任务的对话系统中的关键组成部分。然而，一个实际的挑战是意图类别的数量增长速度快于人工注释数据的速度，导致许多新的意图类别只有少量数据可用。这种数据缺乏导致传统深度神经网络在少量训练数据上过拟合，严重影响了实际应用。因此，一些研究人员提出了小样本学习来解决数据稀缺问题。一种有效的方法是文本数据增强，但它总是生成噪声或无意义的数据。
[0003]在现实世界的应用中，新的意图类别迅速出现，并且只有有限的标注完备的数据，因此很难直接应用于优化现有的深度神经网络。这些网络一般都会包含一个预训练语言模型作为其主干，以将文本数据编码为连续的低维向量，例如BERT和RoBERTa。这样的模型总是具有多层的复杂架构，因此具有的参数量非常可观。如果在传统训练范式的基础上，直接利用少量训练数据更新深度神经网络模型的参数，模型将只能捕捉到局部特征，导致泛化能力不足和过拟合问题，即在训练集上表现良好，在测试集上表现不佳。为了处理这样的问题，Snell等人提出了少样本学习(FSL)策略来帮助模型仅在有限的数据中获得泛化能力。上述研究人员将小样本意图识别视为元学习问题。它通过一系列小的元任务来模拟小样本场景。这种方法广泛应用于关系分类、事件检测和意图检测等小样本文本分类任务领域。
[0004]一个主要的挑战...

【技术保护点】

【技术特征摘要】
1.用于小样本意图识别的完型填空式的数据增强方法，其特征是，包括：基于预训练语言模型构建完型填空式的数据增强任务用于意图识别，先采用无监督学习方法使得数据增强的结果在语义上与原始输入句子相似，然后再基于度量分类采用有监督的对比学习方法，使得同一类别的意图样本在嵌入空间中更接近彼此，不同类别的意图样本更远离彼此，对比学习方法包括原型层面的对比学习和实例层面的对比学习。2.如权利要求1所述的用于小样本意图识别的完型填空式的数据增强方法，其特征是，所述无监督学习方法包括：以预训练语言模型作为特征提取器，采用标记来掩盖设定比例的输入词，根据输入句子的上下文的语义来预测这些被掩盖的标记；特征提取器通过加入两个特殊标记后，将完型填空式的意图识别任务中的句子编码为隐藏层向量表示，两个特殊标记分别表示完型填空式的意图识别任务中句子的开始和结束，该过程通过以下公式表示：其中，F(
·
)为特征提取器，T为完型填空式模板，[MASK]为被掩盖的单词的标记，Pat(T,x)为数据增强模式，x是输入句子，表示隐藏层向量，[CLS]和[SEP]分别表示开始和结束；将隐藏层向量视为被掩盖的单词[MASK]的表示，将看作是根据模式Pat(T，x))生成的句子表示，其在语义上与输入句子x是相似的，所有输入样本上重复公式(1)得到相应的数据增强结果。3.如权利要求2所述的用于小样本意图识别的完型填空式的数据增强方法，其特征是，通过损失函数对预训练语言模型进行约束，用于削弱与输入句子的语义不匹配的向量，最终获得恰当的数据增强结果。4.如权利要求3所述的用于小样本意图识别的完型填空式的数据增强方法，其特征是，在不引入任何外部知识和标签的情况下，将输入句子x送入预训练语言模型中，获得其低维向量表示，将其表述为：其中，隐藏层向量表示为整个句子x，通过以下损失函数：用于缩小和之间的距离。5.如权利要求4所述的用于小样本意图识别的完型填空式的数据增强方法，其特征是，完成无监督的完型填空式数据增强之后，采用基于度量的原型网络作为分类器来检验数据增强的效果。6.如权利要求5所述的用于小样本意图识别的完型填空式的数据增强方法，其特征是，首先计算出同一类别下的样本的平均表示，并以此作为...

【专利技术属性】
技术研发人员：陈洪辉，张鑫，蔡飞，江苗，郑建明，宋城宇，邵太华，郭昱普，王梦如，
申请(专利权)人：中国人民解放军国防科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人