基于元学习任务一致性的低资源语音识别模型训练方法技术

技术编号:40171604 阅读:28 留言:0更新日期:2024-01-26 23:41
本发明专利技术涉及人工智能语音识别技术领域,特别涉及一种基于元学习任务一致性的低资源语音识别模型训练方法,将样本数据按语种划分为训练集和验证集,将每个语种元学习的训练集和验证集再依次分成支持集和查询集;构建语音识别模型,并通过遍历样本数据中每个语种,基于训练集对每个语种下元学习任务中的语音识别模型进行训练,其中,基于支持集进行模型训练并获取任务梯度方向,利用梯度一致性调整各元学习任务权重,基于对应查询集和元学习任务权重更新模型参数;基于验证集数据对训练后的语音识别模型进行测试,利用测试性能最优的模型参数配置目标语音识别模型。本发明专利技术能够解决现有语音识别学习训练中的任务冲突问题,提升语音识别模型训练效果。

【技术实现步骤摘要】

本专利技术涉及人工智能语音识别,特别涉及一种基于元学习任务一致性的低资源语音识别模型训练方法


技术介绍

1、多语迁移学习在训练过程中对不同语言的交互较少,它重在多个语言知识对目标语言的知识补充。因此,迁移学习对目标语言的泛化性不强,其在少样本的情况下效果往往有限。元学习是人工智能中一种专门的学习范式,传统的深度学习方法中是从头开始学习训练,对算力和时间有更大的消耗和考验;而元学习与传统的深度学习方法不同,其强调从不同的若干小任务/小样本来学习一个对未知样本未知类别,有较好的判别和泛化能力。因元学习能够学习一个好的初始化使模型具备对新任务快速适应的能力,其已应用到人脸识别、语音识别、机器翻译、对话系统等诸多领域。元学习在多语言学习中追求高层次的共享特征,模型能够更好地理解和捕捉任务之间的关联性,提高整体学习能力。因此,多语元学习在少样本的情况下展现出更快的适应能力和更好的效果。但是在多语元学习中,一个常见的问题是任务冲突。不同的语言来自不同的地区,具有不同的文化特色、发音系统等,这些差异导致在元学习过程中任务梯度方向会产生差异。而这种不同语言学习方向的区别本文档来自技高网...

【技术保护点】

1.一种基于元学习任务一致性的低资源语音识别模型训练方法,其特征在于,包含如下内容:

2.根据权利要求1所述的基于元学习任务一致性的低资源语音识别模型训练方法,其特征在于,所述语音识别模型包括:用于提取输入数据特征的VGG卷积网络,和用于对特征进行编码并识别处理的Transformer模型。

3.根据权利要求1所述的基于元学习任务一致性的低资源语音识别模型训练方法,其特征在于,基于训练集对每个语种下元学习任务中的语音识别模型进行训练,包含:

4.根据权利要求1或3所述的基于元学习任务一致性的低资源语音识别模型训练方法,其特征在于,获取任务梯度方向的过程...

【技术特征摘要】

1.一种基于元学习任务一致性的低资源语音识别模型训练方法,其特征在于,包含如下内容:

2.根据权利要求1所述的基于元学习任务一致性的低资源语音识别模型训练方法,其特征在于,所述语音识别模型包括:用于提取输入数据特征的vgg卷积网络,和用于对特征进行编码并识别处理的transformer模型。

3.根据权利要求1所述的基于元学习任务一致性的低资源语音识别模型训练方法,其特征在于,基于训练集对每个语种下元学习任务中的语音识别模型进行训练,包含:

4.根据权利要求1或3所述的基于元学习任务一致性的低资源语音识别模型训练方法,其特征在于,获取任务梯度方向的过程,包含:

5.根据权利要求4所述的基于元学习任务一致性的低资源语音识别模型训练方法,其特征在于,...

【专利技术属性】
技术研发人员:屈丹陈雅淇张昊张文林杨绪魁牛铜彭思思
申请(专利权)人:中国人民解放军战略支援部队信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1