【技术实现步骤摘要】
【国外来华专利技术】一种多语言文本合成语音方法、装置、设备及存储介质
本申请涉及语音
,尤其涉及一种多语言文本的语音合成方法、装置、设备及存储介质。
技术介绍
语音合成是语音交互中一个重要的任务,它的目标是将文本信息合成出自然的像真人发出来的声音。传统的语音合成系统包括两个部分:前端和后端。前端的作用是对文本进行分析和语言学信息的提取,比如:分词,词性标注,韵律结构预测等。后端是将从前端获取的语言学信息合成出语音。在过去十多年,语音拼接合成和参数合成被广泛的应用,并且取得了不错的效果。拼接合成需要大量的语料,从语料中选取语音片段合成所需要的语音。虽然合成出的每个片段的语音自然度比较高,但是语音内的连续性不够好。参数合成虽然相对拼接合成需要更少的语料,但是往往因为模型比较复杂,包含了大量的参数,修改起来很费时费力。最近几年,随着深度学习的发展,端到端的语音合成系统被提出来,比如:Tacotron(端到端的深度学习语音合成模型)和Tacotron2,它们使用神经网络简化了传统语音合成的前端。Tacotron和Tacotron2首先直接从文本中生成频谱特征(Melspectrograms)然后使用声码器,比如:Griffin-Lim(采用Griffin-Lim算法音频生成模型)和WaveNet(原始音频生成模型)将频谱特征合成出语音。这种基于神经网络的端到端的模型很大程度上提高了合成的语音质量,其中,这里的端到端模型指的就是带有注意力机制的序列到序列的模型。将文本序列使用编码器映射到语义空间并生成一系列编码器隐藏状态,然 ...
【技术保护点】
1.一种多语言文本的语音合成方法,所述方法包括:/n获取待合成多语言文本;/n将所述待合成多语言文本分别输入至少两个编码规则不同的编码器中进行编码,得到与编码规则对应的文本编码;/n将所有所述编码规则对应的文本编码转换为联合文本编码;/n将所述联合文本编码、标准频谱特征数据输入解码器进行预测解码,得到预测频谱特征;/n将所述预测频谱特征输入声码器进行合成处理,得到与所述待合成多语言文本对应的目标语音。/n
【技术特征摘要】
【国外来华专利技术】1.一种多语言文本的语音合成方法,所述方法包括:
获取待合成多语言文本;
将所述待合成多语言文本分别输入至少两个编码规则不同的编码器中进行编码,得到与编码规则对应的文本编码;
将所有所述编码规则对应的文本编码转换为联合文本编码;
将所述联合文本编码、标准频谱特征数据输入解码器进行预测解码,得到预测频谱特征;
将所述预测频谱特征输入声码器进行合成处理,得到与所述待合成多语言文本对应的目标语音。
2.根据权利要求1所述的多语言文本的语音合成方法,其特征在于,所述将所有所述编码规则对应的文本编码转换为联合文本编码,包括:
将所有所述编码规则对应的文本编码进行拼接,得到拼接文本编码;
将所述拼接文本编码进行线性仿射变换,得到联合文本编码。
3.根据权利要求1所述的多语言文本的语音合成方法,其特征在于,所述将所述联合文本编码、标准频谱特征数据输入解码器进行预测解码,得到预测频谱特征,包括:
将所述联合文本编码进行高层特征提取得到联合文本编码高层特征;
将所述联合文本编码高层特征、所述标准频谱特征数据输入解码器进行预测解码,得到所述预测频谱特征。
4.根据权利要求2所述的多语言文本的语音合成方法,其特征在于,所述将所述待合成多语言文本分别输入至少两个编码规则不同的编码器中进行编码,得到与编码规则对应的文本编码,包括:
将所述待合成多语言文本输入One-hot编码器进行编码,得到与One-hot编码器对应的One-hot文本编码;
将所述待合成多语言文本输入UTF-8编码器进行编码,得到与UTF-8编码器对应的UTF-8文本编码;
将所述待合成多语言文本输入音素编码器进行编码,得到与音素编码器对应的音素文本编码。
5.根据权利要求4所述的多语言文本的语音合成方法,其特征在于,所述将所有所述编码规则对应的文本编码进行拼接,得到拼接文本编码,包括:
将所述One-hot文本编码、所述UTF-8文本编码、所述音素文本编码在通道维度上进行拼接,得到拼接文本编码,所述拼接文本编码包括三维数据;其中,第一维数据为所述One-hot文本编码,第二维数据为所述UTF-8文本编码,第三维数据为所述音素文本编码。
6.根据权利要求2所述的多语言文本的语音合成方法,其特征在于,所述将所述拼接文本编码进行线性仿射变换,得到联合文本编码,包括:
将多维的所述拼接文本编码输入第一神经网络进行线性仿射变换对所述编码规则对应的文本编码进行选择,得到联合文本编码。
7.根据权利要求3所述的多语言文本的语音合成方法,其特征在于,所述将所述联合文本编码进行高层特征提取,得到联合文本编码高层特征,包括:
将所述联合文本编码输入第二神经网络进行高层特征提取,得到联合文本编码高层特征。
8.根...
【专利技术属性】
技术研发人员:黄东延,盛乐园,熊友军,
申请(专利权)人:深圳市优必选科技股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。