一种合成歌声音频的方法以及装置制造方法及图纸

技术编号：26973587 阅读：24 留言：0更新日期：2021-01-06 00:07

本公开是关于一种合成歌声音频的方法以及装置，属于音频处理领域。所述方法包括：获取预存的平均歌声模型；获取目标歌声数据的目标特征值文本以及目标声学参数；根据所述目标特征值文本以及所述目标声学参数，确定所述目标发音人的特征值文本与声学参数的特征对应表；基于所述目标特征值文本以及所述目标声学参数，对所述平均歌声模型进行训练，得到目标歌声模型；当接收到待合成曲谱时，提取所述待合成曲谱的特征值文本，基于所述待合成曲谱的特征值文本、所述目标歌声模型以及所述特征对应表，得到所述待合成曲谱对应的目标歌声音频。采用本公开，可以提高歌声合成的效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种合成歌声音频的方法以及装置
本公开涉及音频处理领域，尤其涉及一种合成歌声音频的方法以及装置。
技术介绍
随着音频技术的发展，歌声合成技术也随着越见成熟。歌声合成的目的是让计算机像人类一样唱歌，是一种计算机与音乐艺术的交叉学科问题。目前，基于合成的质量以及多样性考虑，传统的歌声合成的方式通常是采用样本对歌声合成模型进行训练，歌声合成模型可以是HMM(HiddenMarkovModel，隐含马尔柯夫模型)等，使用歌声合成模型前，需要对歌声合成模型进行训练，为了达到歌声合成模型的准确率，需要准备大量的样本对初始模型进行训练，训练的过程计算量巨大，耗时较长，导致训练效率较低，进而使得歌声合成的效率较低。
技术实现思路
本公开提供一种合成歌声音频的方法以及装置，可以解决歌声合成效率低的问题。根据本公开实施例的第一方面，提供一种合成歌声音频的方法，包括：获取预存的平均歌声模型；获取目标歌声数据的目标特征值文本以及目标声学参数；根据所述目标特征值文本以及所述目标声学参数，确定所述目标发音人的...

【技术保护点】
1.一种合成歌声音频的方法，其特征在于，所述方法包括：/n获取预存的平均歌声模型；/n获取目标歌声数据的目标特征值文本以及目标声学参数；/n根据所述目标特征值文本以及所述目标声学参数，确定所述目标发音人的特征值文本与声学参数的特征对应表；/n基于所述目标特征值文本以及所述目标声学参数，对所述平均歌声模型进行训练，得到目标歌声模型；/n当接收到待合成曲谱时，提取所述待合成曲谱的特征值文本，基于所述待合成曲谱的特征值文本、所述目标歌声模型以及所述特征对应表，得到所述待合成曲谱对应的目标歌声音频。/n

【技术特征摘要】
1.一种合成歌声音频的方法，其特征在于，所述方法包括：
获取预存的平均歌声模型；
获取目标歌声数据的目标特征值文本以及目标声学参数；
根据所述目标特征值文本以及所述目标声学参数，确定所述目标发音人的特征值文本与声学参数的特征对应表；
基于所述目标特征值文本以及所述目标声学参数，对所述平均歌声模型进行训练，得到目标歌声模型；
当接收到待合成曲谱时，提取所述待合成曲谱的特征值文本，基于所述待合成曲谱的特征值文本、所述目标歌声模型以及所述特征对应表，得到所述待合成曲谱对应的目标歌声音频。

2.根据权利要求1所述的合成歌声音频的方法，其特征在于，所述获取预存的平均歌声模型，包括：
获取多个样本发音人的样本歌声数据；
提取所述样本歌声数据的样本特征值文本以及样本声学参数；
基于所述样本特征值文本以及所述样本声学参数，对初始歌声模型进行训练，得到平均歌声模型。

3.根据权利要求1所述的合成歌声音频的方法，其特征在于，所述根据所述目标特征值文本以及所述目标声学参数，确定所述目标发音人的特征值文本与声学参数的特征对应表，包括：
截取所述目标歌声数据的每个子音以及每个母音对应的声学参数，将每个子音以及每个母音对应的声学参数的对应关系确定为所述目标发音人的特征值文本与声学参数的特征对应表。

4.根据权利要求1所述的合成歌声音频的方法，其特征在于，所述基于所述目标特征值文本以及所述目标声学参数，对所述平均歌声模型进行训练，得到目标歌声模型，包括：
将所述目标特征值文本输入所述平均歌声模型，得到输出的预测声学参数；
基于所述预测声学参数与所述目标声学参数的对比，对所述平均歌声模型内的模型参数进行调整，直到所述预测声学参数与所述目标声学参数的误差值小于或等于预设误差值为止，将最后一次调整后的模型参数确定为目标歌声模型的模型参数，得到目标歌声模型。

5.根据权利要求1所述的合成歌声音频的方法，其特征在于，所述待合成曲谱的特征值文本包括子音音符对应的特征值文本、母音音符对应的特征值文本以及过渡音符对应的特征值文本，
所述基于所述待合成曲谱的特征值文本、所述目标歌声模型以及所述特征对应表，得到所述待合成曲谱对应的目标歌声音频，包括：
将所述子音音符对应的特征值文本以及过渡音符对应的特征值文本输入所诉目标歌声模型中，得到子音音符对应的声学参数以及过渡音符对应的声学参数；
在所述特征对应表中，将所述母音音符对应的特征值文本对应的声学参数，确定为母音音符对应的声学参数；
将所述子音音符对应的声学参数、过渡音符对应的声学参数以及母音音符对应的声学参数进行混合处理，得到待合...

【专利技术属性】
技术研发人员：卢迪，
申请(专利权)人：长春迪声软件有限公司，
类型：发明
国别省市：吉林;22

全部详细技术资料下载我是这个专利的主人