用于语音合成的文本分析方法、装置、服务器和介质制造方法及图纸

技术编号：27364535 阅读：26 留言：0更新日期：2021-02-19 13:47

本申请实施例公开了用于语音合成的文本分析方法、装置、服务器和介质。该方法的一具体实施方式包括：获取待合成语音的文本；将该待合成语音的文本输入至预先训练的文本分析模型，得到文本分析结果，其中，该文本分析模型包括特征共享层和至少两个子任务模型，该文本分析结果包括该待合成语音的文本中与该至少两个子任务模型对应输出的标签。该实施方式减少了语音合成前端处理的流程，并且可以减少子任务的过拟合风险，从而提升文本分析模型的性能。能。能。

全部详细技术资料下载

【技术实现步骤摘要】
用于语音合成的文本分析方法、装置、服务器和介质

[0001]本申请实施例涉及计算机
，具体涉及用于语音合成的文本分析方法、装置、服务器和介质。

技术介绍

[0002]随着人工智能技术的发展，语音合成(Text To Speech，TTS)技术也取得了越来越多的应用。当前，语音合成技术主要分为前端和后端两大部分。其中，前端技术主要用于对文本进行语言学分析。其可以包括但不限于以下至少一项：语种判断，文本规范化(比如确定各种符号、数字的读法)，语言学特征提取(例如分词、多音字)，韵律分析和预测等等。
[0003]通常采用流水线(pipeline)结构对语音合成前端的各项子任务进行依次处理，从而完成文本分析。

技术实现思路

[0004]本申请实施例提出了用于语音合成的文本分析方法、装置、服务器和介质。
[0005]第一方面，本申请实施例提供了一种用于语音合成的文本分析方法，该方法包括：获取待合成语音的文本；将待合成语音的文本输入至预先训练的文本分析模型，得到文本分析结果，其中，文本分析模型包括特征共享层和至少两个子任务模型，文本分析结果包括待合成语音的文本中与至少两个子任务模型对应输出的标签。
[0006]在一些实施例中，上述文本分析模型通过以下步骤训练得到：获取训练样本集合，其中，训练样本集合中的训练样本包括用于训练至少两个子任务模型的样本输入和样本标注信息；将训练样本集合中的训练样本的样本输入作为输入，将与输入的样本输入对应的样本标注信息作为期望输出，训练得到文本分析模型。<...

【技术保护点】

【技术特征摘要】
1.一种用于语音合成的文本分析方法，包括：获取待合成语音的文本；将所述待合成语音的文本输入至预先训练的文本分析模型，得到文本分析结果，其中，所述文本分析模型包括特征共享层和至少两个子任务模型，所述文本分析结果包括所述待合成语音的文本中与所述至少两个子任务模型对应输出的标签。2.根据权利要求1所述的方法，其中，所述文本分析模型通过以下步骤训练得到：获取训练样本集合，其中，所述训练样本集合中的训练样本包括用于训练所述至少两个子任务模型的样本输入和样本标注信息；将所述训练样本集合中的训练样本的样本输入作为输入，将与输入的样本输入对应的样本标注信息作为期望输出，训练得到所述文本分析模型。3.根据权利要求1所述的方法，其中，所述至少两个子任务模型中包括韵律预测模型；所述韵律预测模型中包括字符向量表示网络和序列标注网络。4.根据权利要求3所述的方法，其中，用于训练所述韵律预测模型的样本输入和样本标注信息包括样本文本和与样本文本对应的韵律停顿标注。5.根据权利要求4所述的方法，其中，所述字符向量表示网络包括BERT模型，所述序列...

【专利技术属性】
技术研发人员：刘世超，
申请(专利权)人：北京有竹居网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人