训练多任务处理模型的方法、语音合成的方法及相关产品技术

技术编号：37867839 阅读：8 留言：0更新日期：2023-06-15 20:57

本发明专利技术的实施方式提供了一种训练多任务处理模型的方法及相关产品。其中，该方法包括获取关于多任务处理模型的训练数据和多个教师模型，其中，多任务处理模型配置为执行语音合成中的多类文本分析任务，每个教师模型配置为执行单一类文本分析任务；基于教师模型和多任务处理模型针对训练数据的预测结果，确定关于多任务处理模型的目标损失；以及基于目标损失对多任务处理模型进行优化训练。通过本发明专利技术的技术方案，通过多任务处理模型的训练以使其可以同时应用在多个任务上，打破了传统的流水线组合分析方式，实现对质量和性能兼顾。另外，本发明专利技术的实施方式还提供了一种语音合成的方法。法。法。

全部详细技术资料下载

【技术实现步骤摘要】
训练多任务处理模型的方法、语音合成的方法及相关产品

[0001]本专利技术的实施方式涉及语音处理
，更具体地，本专利技术的实施方式涉及训练多任务处理模型的方法，语音合成的方法以及执行前述方法的电子设备和计算机可读存储介质。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述可包括可以探究的概念，但不一定是之前已经想到或者已经探究的概念。因此，除非在此指出，否则在本部分中描述的内容对于本申请的说明书和权利要求书而言不是现有技术，并且并不因为包括在本部分中就承认是现有技术。
[0003]语音合成的技术本质可以理解为是将文本转换为语音，并让机器开口说话。相关技术中，语音合成系统可以由前端和后端两个部分组成。其中，前端通过将输入的文本经过各种各样的文本分析，然后生成一个语言学规格书，后端基于这份语言学规格书去生成对应的语音。因此，前端可以看作为一个语言学家，是整个语音合成系统里面最复杂的部分，为了生成这个语言学规格书，需要经过很多个环节，任何一个模块出错，都会直接影响最终的语音合成效果。然而，目前前端在文本分析过程中，针对文本分析任务基本采用的都是流水线形式的分析方式，也即一次仅执行一种文本分析任务，且上一任务的分析结果作为下一任务的输入。在这种传统的流水线式分析方法中，各个模块会占用独立的资源，对资源消耗比较大，同时模块之间级联错误问题比较多，维护成本很高。可以看出，这种传统的流式线式分析方法应用场景比较局限，其需要高性能的平台支持才能保证文本分析质量，对于性...

【技术保护点】

【技术特征摘要】
1.一种训练多任务处理模型的方法，其特征在于，包括：获取关于所述多任务处理模型的训练数据和多个教师模型，其中，所述多任务处理模型配置为执行语音合成中的多类文本分析任务，每个所述教师模型配置为执行单一类所述文本分析任务；基于所述教师模型和所述多任务处理模型针对所述训练数据的预测结果，确定关于所述多任务处理模型的目标损失；以及基于所述目标损失对所述多任务处理模型进行优化训练。2.根据权利要求1所述的方法，其特征在于，其中，所述训练数据包括无标签数据和混合标签数据，所述混合标签数据中的数据至少标注有部分任务的标签，确定关于所述多任务处理模型的目标损失包括：响应于训练数据包含所述无标签数据，根据每个所述教师模型和所述多任务处理模型对所述无标签数据的预测结果确定第一目标损失；以及响应于训练数据包含所述混合标签数据，根据部分所述教师模型和所述多任务处理模型对所述混合标签数据的预测结果确定第二目标损失。3.根据权利要求2所述的方法，其特征在于，根据每个所述教师模型和所述多任务处理模型对所述无标签数据的预测结果确定第一目标损失包括：根据每个所述教师模型和所述多任务处理模型对所述无标签数据的预测结果构造第一蒸馏损失，并根据所述第一蒸馏损失确定所述第一目标损失，以基于所述第一蒸馏损失引导所述多任务处理模型学习每个所述教师模型。4.根据权利要求2所述的方法，其特征在于，根据部分所述教师模型和所述多任务处理模型对所述混合标签数据的预测结果以及已标注的任务标签确定第二目标损失包括：将标注有部分标签的数据分别输入至所述多任务处理模型和用于执行所述数据缺失标签对应任务的教师模型中进行预测，并基于预测结果构造第二蒸馏损失；以及计算所述多任务处理模型对所述混合标签数据的预测结果与对应的已标注的任务标签之间的交叉熵损失，并根据所述...

【专利技术属性】
技术研发人员：陈汉英，孙艳庆，段亦涛，
申请(专利权)人：网易有道信息技术北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人