语音合成方法、装置、电子设备、存储介质及产品制造方法及图纸

技术编号:45501033 阅读:19 留言:0更新日期:2025-06-10 17:56
本公开涉及一种语音合成方法、装置、电子设备、存储介质及产品,涉及语音合成技术领域,包括:对目标用户对应的文本信息和情感信息进行处理,得到标记序列;通过目标语音合成模型对标记序列进行处理,得到目标语音频谱,目标语音合成模型基于多个语音训练样本训练基础语音合成模型得到,语音训练样本包括样本文本信息、样本情感信息和样本语音;根据目标语音频谱,得到目标合成语音。可生成融合了情感的目标合成语音,从而使生成的目标合成语音不仅能够表达用户的语义,还能够表达用户的情感。

【技术实现步骤摘要】

本公开涉及语音合成,尤其涉及一种语音合成方法、装置、电子设备、存储介质及产品


技术介绍

1、语音合成技术不仅能够提供更加自然流畅的语音输出,还在文语转换、歌唱合成、音乐合成、口型合成以及虚拟人动作合成等多个领域发挥着重要作用。

2、相关技术中,语音合成的目标是生成清晰和自然的语音,主要关注语音的可懂度和流畅性。


技术实现思路

1、为克服相关技术中存在的问题,本公开提供一种语音合成方法、装置、电子设备、存储介质及产品,可先对目标用户对应的文本信息和情感信息进行处理,得到融合了情感信息的标记序列,进而通过预先训练完成的目标语音合成模型对标记序列进行处理,该目标语音合成模型基于包括样本文本信息、样本情感信息和样本语音的多个语音训练样本训练基础语音合成模型得到,从而能够得到携带情感信息的目标语音频谱。进而通过目标语音频谱,即可生成融合了情感的目标合成语音,从而使生成的目标合成语音不仅能够表达用户的语义,还能够表达用户的情感。

2、根据本公开实施例的第一方面,提供一种语音合成方法,包括:...

【技术保护点】

1.一种语音合成方法,其特征在于,包括:

2.根据权利要求1所述的语音合成方法,其特征在于,所述语音训练样本还包括样本附加信息;

3.根据权利要求1所述的语音合成方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的语音合成方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的语音合成方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的语音合成方法,其特征在于,所述方法还包括:

7.根据权利要求1所述的语音合成方法,其特征在于,所述多个语音训练样本包括不同音色对应的多个第一训练样本,所述目标语音合...

【技术特征摘要】

1.一种语音合成方法,其特征在于,包括:

2.根据权利要求1所述的语音合成方法,其特征在于,所述语音训练样本还包括样本附加信息;

3.根据权利要求1所述的语音合成方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的语音合成方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的语音合成方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的语音合成方法,其特征在于,所述方法还包括:

7.根据权利要求1所述的语音合成方法,其特征在于,所述多个语音训练样本包括不同音色对应的多个第一训练样本,所述目标语音合成模型通过以下步骤得到:

8.根据权利要求7所述的语音合成方法,其特征在于,所述多个语音训练样本还包括目标音色对应的多个第二训练样本;

9.根据权利要求8所述的语音合成方法,其特征在于,

10.根据权利要求9所述的语音合成方法,其特征在于,所述第一训练样本还包括样本附加信息,所述样本附加...

【专利技术属性】
技术研发人员:郝东亮
申请(专利权)人:小米汽车科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1