语音合成方法、装置、电子设备、计算机可读存储介质及计算机程序产品制造方法及图纸

技术编号:46478666 阅读:5 留言:0更新日期:2025-09-23 22:38
本申请提供了一种语音合成方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:对第一文本进行特征提取,得到第一文本特征,并对第二文本进行特征提取,得到第二文本特征,第二文本用于描述第一语音簇的语音风格;基于第二文本特征对第一文本特征进行注意力调整,得到第三文本特征,并基于第一文本特征对第二文本特征进行注意力调整,得到第四文本特征;基于第三文本特征和第四文本特征,确定第一文本和第二文本的第一相似度;在所述第一语音簇中确定与第一相似度最高的第二文本相匹配的第一语音,并基于第一语音合成第一文本的第二语音。通过本申请,能够使得针对第一文本合成的语音,更加符合第一文本所表示的风格。

【技术实现步骤摘要】

本申请涉及语音合成技术,尤其涉及一种语音合成方法、装置、电子设备、计算机可读存储介质及计算机程序产品


技术介绍

1、文本到语音合成(text-to-speech,tts)是一种将书面文本转换为人类可听语音的技术。它通过计算机算法和语言处理技术,将输入的文本的文字信息转化为自然流畅的语音输出,文本到语音合成技术可广泛应用于语音助手、无障碍服务、教育、娱乐、导航系统等领域。


技术实现思路

1、本申请实施例提供一种语音合成方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够使得针对第一文本合成的语音,更加符合第一文本所表示的风格。

2、本申请实施例的技术方案是这样实现的:

3、本申请实施例提供一种语音合成方法,所述方法包括:

4、对第一文本进行特征提取,得到第一文本特征,并对第二文本进行特征提取,得到第二文本特征,所述第二文本用于描述第一语音簇的语音风格;基于所述第二文本特征对所述第一文本特征进行注意力调整,得到第三文本特征,并基于所述第一文本特征对所述第二文本特征进本文档来自技高网...

【技术保护点】

1.一种语音合成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述第二文本特征对所述第一文本特征进行注意力调整,得到第三文本特征,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述第一文本特征对所述第二文本特征进行注意力调整,得到第四文本特征,包括:

4.根据权利要求1所述的方法,其特征在于,所述对第二文本进行特征提取之前,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述基于所述第一语音样本的风格特征,对所述第一语音组中的多个所述第一语音样本进行聚类,得到第一语音簇,包括:<...

【技术特征摘要】

1.一种语音合成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述第二文本特征对所述第一文本特征进行注意力调整,得到第三文本特征,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述第一文本特征对所述第二文本特征进行注意力调整,得到第四文本特征,包括:

4.根据权利要求1所述的方法,其特征在于,所述对第二文本进行特征提取之前,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述基于所述第一语音样本的风格特征,对所述第一语音组中的多个所述第一语音样本进行聚类,得到第一语音簇,包括:

6.根据权利要求5所述的方法,其特征在于,所述基于所述语音集中的各所述第一语音样本的语义特征,对所述语音集中的第一语音样本进行聚类,得到第二语音簇,包括:

7.根据权利要求5所述的方法,其特征在于,所述基于所述语音集中的各所述第一语音样本的语义特征,对所述语音集中的第一语音样本进行聚类,得到第二语音簇,包括:<...

【专利技术属性】
技术研发人员:乔宏利
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1