语音合成模型训练及语音合成方法、装置及语音合成器制造方法及图纸

技术编号：28059069 阅读：21 留言：0更新日期：2021-04-14 13:34

本发明专利技术提供了一种语音合成模型训练及语音合成方法、装置及语音合成器，采用的的语音合成模型是一种全卷积语音合成模型，全卷积语音合成模型可以对多个待合成数据执行并行处理，提高语音合成效率。在对全卷积语音合成模型进行训练的过程中，通过调用待训练全卷积语音合成模型，对所述声学特征训练样本进行处理，得到离散语音合成结果，将所述离散语音合成结果转化为连续语音合成结果，进而利用连续语音合成结果得到损失函数，才能够利用损失函数对所述待训练全卷积语音合成模型的模型参数进行调整，即对待训练全卷积语音合成模型的模型参数进行优化，经过模型参数优化，最终得到的训练好的全卷积语音合成模型能够提高语音合成质量。音合成质量。音合成质量。

全部详细技术资料下载

【技术实现步骤摘要】
语音合成模型训练及语音合成方法、装置及语音合成器

[0001]本专利技术涉及人工智能
，更具体的说，是涉及一种语音合成模型训练及语音合成方法、装置及语音合成器。

技术介绍

[0002]随着人工智能技术的发展，语音合成技术越来越受到人们的重视，语音合成技术可以应用在人机交互或者将文本转化成自然语言输出等领域，目前采用循环神经网络模型进行语音合成，但利用循环神经网络模型进行语音合成的方式存在合成效率低的问题。
[0003]基于此，如何提高语音合成效率，成为目前需要解决的技术问题。

技术实现思路

[0004]有鉴于此，本专利技术提供一种语音合成模型训练及语音合成方法、装置及语音合成器，以提高语音合成效率。
[0005]为实现上述目的，本专利技术提供如下技术方案：
[0006]一种语音合成模型训练方法，所述方法包括：
[0007]获取声学特征训练样本；
[0008]调用待训练全卷积语音合成模型，对所述声学特征训练样本进行处理，得到离散语音合成结果；
[0009]将所述离散语音合成结果转化为连续语音合成结果；
[0010]对所述连续语音合成结果以及声学特征训练样本对应的参考输出语音合成结果进行比较，利用比较结果得到所述待训练全卷积语音合成模型的损失函数；
[0011]利用所述损失函数对所述待训练全卷积语音合成模型的模型参数进行调整；
[0012]将参数调整后的全卷积语音合成模型作为待训练全卷积语音合成模型，并返回执行调用待训练全卷积语...

【技术保护点】

【技术特征摘要】
1.一种语音合成模型训练方法，其特征在于，所述方法包括：获取声学特征训练样本；调用待训练全卷积语音合成模型，对所述声学特征训练样本进行处理，得到离散语音合成结果；将所述离散语音合成结果转化为连续语音合成结果；对所述连续语音合成结果以及声学特征训练样本对应的参考输出语音合成结果进行比较，利用比较结果得到所述待训练全卷积语音合成模型的损失函数；利用所述损失函数对所述待训练全卷积语音合成模型的模型参数进行调整；将参数调整后的全卷积语音合成模型作为待训练全卷积语音合成模型，并返回执行调用待训练全卷积语音合成模型，对所述声学特征训练样本进行处理的步骤，直到满足模型训练终止条件；将满足模型训练终止条件时的模型参数作为所述待训练全卷积语音合成模型的模型参数，得到训练好的全卷积语音合成模型。2.根据权利要求1所述的方法，其特征在于，所述将所述离散语音合成结果转化为连续语音合成结果包括：获取服从均匀分布的均匀分布采样结果；利用离散语音合成结果以及均匀分布采样结果，得到满足离散多项分布的语音合成概率分布结果；利用连续性函数对所述语音合成概率分布结果进行处理，得到连续语音合成结果。3.根据权利要求1所述的方法，其特征在于，所述损失函数至少包括：短时傅里叶变换STFT损失函数。4.根据权利要求3所述的方法，其特征在于，所述利用所述损失函数对所述待训练全卷积语音合成模型的模型参数进行调整包括：从所述损失函数中得到所述连续语音合成结果对应的连续语音合成频谱，以及所述参考输出语音合成结果对应的参考输出语音合成频谱；将所述连续语音合成频谱与所述参考输出语音合成频谱进行比较，利用比较结果，得到所述待训练全卷积语音合成模型的模型梯度；沿所述待训练全卷积语音合成模型的模型梯度下降的方向，对所述待训练全卷积语音合成模型的模型参数进行调整。5.根据权利要求1所述的方法，其特征...

【专利技术属性】
技术研发人员：马达标，
申请(专利权)人：上海优扬新媒信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人