基于多尺度风格的语音合成方法、装置、设备及介质制造方法及图纸

技术编号：38527067 阅读：8 留言：0更新日期：2023-08-19 17:02

本申请涉及人工智能技术领域，公开了一种基于多尺度风格的语音合成方法、装置、计算机设备及存储介质，解决传统语音合成方案机器感较强、情感不够丰富的问题，方法部分包括：提取原始语音对应的目标音频和目标文本；对所述目标音频进行风格分析，得到第一风格嵌入向量；对所述目标文本进行风格预测，得到第二风格嵌入向量；融合所述第一风格嵌入向量和所述第二风格嵌入向量，得到目标风格嵌入向量；基于所述目标风格嵌入向量合成目标语音。述目标风格嵌入向量合成目标语音。述目标风格嵌入向量合成目标语音。

全部详细技术资料下载

【技术实现步骤摘要】
基于多尺度风格的语音合成方法、装置、设备及介质

[0001]本申请涉及人工智能
，尤其涉及一种基于多尺度风格的语音合成方法、装置、计算机设备及存储介质。

技术介绍

[0002]现有的语音合成技术已经取得了长足的进步，但是在实际生产生活中，人们很容易就分辨出是对话的另一端是机器人还是真人，这是因为合成的语音数据一般会考虑追求平稳，因此在情感和表达方面也就不会太丰富。
[0003]随着但近些年大家对情感合成以及个性化合成的兴趣与需求越来越高，目前情感语音合成工作的侧重点，基本都是在于从语句中获取上下文信息建立单一尺度的模型，却忽略了语音风格的在不同尺度上的差异性，导致合成语音的风格情况还是比较单一，不够丰富，机器感比较明显。

技术实现思路

[0004]本申请实施例提供一种基于多尺度风格的语音合成方法、装置、计算机设备及存储介质，以解决传统方案的合成语音的风格情况还是比较单一，不够丰富，机器感比较明显问题。
[0005]一种基于多尺度风格的语音合成方法，包括：
[0006]提取原始语音对应的目标音频和目标文本；
[0007]对所述目标音频进行风格分析，得到第一风格嵌入向量；
[0008]对所述目标文本进行风格预测，得到第二风格嵌入向量；
[0009]融合所述第一风格嵌入向量和所述第二风格嵌入向量，得到目标风格嵌入向量；
[0010]基于所述目标风格嵌入向量合成目标语音。
[0011]一种基于多尺度风格的语音合成装置，包括：
[00...

【技术保护点】

【技术特征摘要】
1.一种基于多尺度风格的语音合成方法，其特征在于，包括：提取原始语音对应的目标音频和目标文本；对所述目标音频进行风格分析，得到第一风格嵌入向量；对所述目标文本进行风格预测，得到第二风格嵌入向量；融合所述第一风格嵌入向量和所述第二风格嵌入向量，得到目标风格嵌入向量；基于所述目标风格嵌入向量合成目标语音。2.如权利要求1所述的基于多尺度风格的语音合成方法，其特征在于，所述对所述目标音频进行风格分析，得到第一风格嵌入向量，包括：提取所述目标音频的梅尔谱作为局部梅尔谱；获取所述目标音频的上下文语音的梅尔谱，并将所述上下文音频的梅尔谱和所述目标音频的梅尔谱进行拼接，得到全局梅尔谱；提取所述目标音频中按照子词音素边界划分出的子音频的梅尔谱作为片段梅尔谱；分别对所述全局梅尔谱、局部梅尔谱和片段梅尔谱进行风格编码以及分别将编码后的风格信息输入相应的风格标签层，得到全局音频风格向量、局部音频风格向量和片段音频风格向量；根据所述全局音频风格向量、局部音频风格向量和片段音频风格向量，得到所述目标音频的总情感风格变量作为第一风格嵌入向量。3.如权利要求2所述的基于多尺度风格的语音合成方法，其特征在于，所述分别对所述全局梅尔谱、局部梅尔谱和片段梅尔谱进行风格编码以及分别将编码后的风格信息输入相应的风格标签层，得到全局音频风格向量、局部音频风格向量和片段音频风格向量，包括：将所述全局梅尔谱进行风格编码，得到全局音频风格作为第一残差风格，并分别对所述局部梅尔谱和片段梅尔谱进行风格编码，得到局部音频风格和片段音频风格；将所述局部音频风格减去所述全局音频风格，得到第二残差风格；将所述片段音频风格减去所述局部音频风格，得到第三残差风格；分别将第一残差风格、第二残差风格和第三残差风格输入相应的风格标签层，得到全局音频风格向量、局部音频风格向量和片段音频风格向量。4.如权利要求1所述的基于多尺度风格的语音合成方法，其特征在于，所述对所述目标文本进行风格预测，得到第二风格嵌入向量，包括：提取所述目标文本的语义作为局部语义序列；将所述目标文本的上下文文本，和所述目标文本连接拼接文本，提取所述拼接文本的语义得到全局语义序列；提取所述目标文本中划分出的子词集合的语义序列作为片段语义序列；分别对所述全局语义序列、局部语义序列和片段语义序列进行风格预测，得到全局文本风格向量、局部文本风格向量和片段文本风格向量；叠加所述全局文本风格向量、局部文本风格向量和片段文本风格向量，得到所述目标文本的总情感...

【专利技术属性】
技术研发人员：张旭龙，王健宗，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人