一种基于元学习的对抗采样训练方法及装置制造方法及图纸

技术编号：28424849 阅读：27 留言：0更新日期：2021-05-11 18:33

本发明专利技术公开了一种基于元学习的对抗采样训练方法及装置，所述方法：根据策略网络从K个语种构成的大任务集T中输出K维概率向量

全部详细技术资料下载

【技术实现步骤摘要】
一种基于元学习的对抗采样训练方法及装置
本专利技术涉及语音识别
，尤其涉及一种基于元学习的对抗采样训练方法及装置。
技术介绍
随着深度学习理论和相关技术的蓬勃发展，语音识别领域取得了巨大的进展。然而构造一个端到端的深层语音识别模型经常需要大量的有标注的数据，而这些数据对于许多低资源语种是非常难以获取的。为了解决上述问题，有许多工作利用无监督预训练和半监督学习的方法去利用大量无标注数据来帮助低资源目标语种提升识别效果，但是这些方法依然需要大量目标语种的无标注数据，对于部分小语种来说，无标注数据也是很少量的。因此，迁移学习被引入解决低资源语种识别问题，迁移学习通过其他语种的数据来帮助目标低资源语种来提升识别效果。同时还有多语种迁移学习方法用多个其他源语种预训练模型初始化参数，于是只需要少量低资源目标语种数据在预训练模型基础上训练就可以得到较好的目标模型。但迁移学习的方法学习到的模型参数比较容易倾向于源语种而无法很好地进行迁移。除此之外，元学习的方法也被引入到低资源语音识别问题中。元学习的方法通过一系列训练任务来元学习得到模型初始化参数，以便能够快速地适应到只有少量数据的新任务上，这种方法十分适用于低资源的场景。然而，现有应用低资源语音识别和低资源语码转换的语音识别中，都忽略了在真实场景中任务不均衡的问题，现有技术平等地利用每个语种的元信息，从而导致了效果的损失。
技术实现思路
本专利技术目的在于，提供一种基于元学习的对抗采样训练方法及装置，以多语种元学习语音识别框架为基础，引入策...

【技术保护点】
1.一种基于元学习的对抗采样训练方法，其特征在于，包括：/n根据策略网络从K个语种构成的大任务集T中输出K维概率向量

【技术特征摘要】
1.一种基于元学习的对抗采样训练方法，其特征在于，包括：
根据策略网络从K个语种构成的大任务集T中输出K维概率向量其中，为第i个语种任务集对应的采样概率，根据所述采样概率选取前M个概率最大的语种，根据所述M个概率最大语种中每个语种采样一个任务构成训练任务集，将所述训练任务集划分为支持集和查询集；
所述支持集对语音识别模型初始化参数θ进行梯度下降得到更新参数
所述查询集根据查询所述更新参数的效果获得查询损失向量所述查询损失向量用于对所述初始化参数θ寻优，获得最优的模型参数。

2.根据权利要求1所述的基于元学习的对抗采样训练方法，其特征在于，所述根据策略网络从K个语种构成的大任务集T中输出K维概率向量其中，为第i个语种任务集对应的采样概率，根据所述采样概率选取前M个概率最大的语种，根据所述M个概率最大语种中每个语种采样一个任务构成训练任务集，将所述训练任务集划分为支持集和查询集，包括：
所述策略网络包括前馈注意力层和LSTM层；
所述策略网络通过所述LSTM层中存储的长短期记忆信息和当前查询损失向量获取采样任务，其中，所述采样任务根据所述采样概率获得所述训练任务集。

3.根据权利要求1所述的基于元学习的对抗采样训练方法，其特征在于，所述查询集根据查询所述更新参数的效果获得查询损失向量所述查询损失向量用于对所述初始化参数θ寻优，获得最优的模型参数，包括：
每一次训练获取当前训练步的查询损失向量与概率向量，将所述查询损失向量与所述概率向量输入下一次训练的策略网络，将所述查询损失向量与所述概率向量合并计算前馈注意力，所述前馈注意力通过全连接层输出cs+1。

4.根据权利要求3所述的基于元学习的对抗采样训练方法，其特征在于，所述查询集根据查询所述更新参数的效果获得查询损失向量所述查询损失向量用于对所述初始化参数θ寻优，获得最优的模型参数，还包括：
将所述全连接层输出的cs+1与上一次训练中LSTM层的隐藏状态hs作为输入当前LSTM层的值，生成所述当前LSTM层的输出ys+1与当前隐藏状态hs+1，基于所述当前LSTM层的输出值通过全连接层与Softmax函数预测当前的概率向量根据所述概率向量，选取前M个概率最大的语种，根据所述M个概率最大语种中每个语种采样一个任务构成训练任务集，获取所述查询损失向量并用于对所述初始化参数θ寻优，获得最优的模型参数。

5.一种基于元学习的对抗采样训...

【专利技术属性】
技术研发人员：肖雨蓓，郑国林，聂琳，梁小丹，王青，林倞，
申请(专利权)人：中山大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人