语音合成方法和装置、电子设备及存储介质制造方法及图纸

技术编号:44476918 阅读:18 留言:0更新日期:2025-03-04 17:45
本申请实施例提供了一种语音合成方法和装置、电子设备及存储介质,属于语音合成技术领域,适用于金融科技领域。该方法包括:获取语音合成文本及目标音频数据;获取初始语音特征提取子模型、文本编码子模型及音频信号生成子模型;基于语音样本数据对初始语音特征提取子模型进行训练,得到目标语音特征提取子模型;基于目标语音特征提取子模型,对目标音频数据进行特征提取,得到目标音频特征向量;基于文本编码子模型,对语音合成文本进行文本编码,得到文本编码向量;基于目标音频特征向量,对文本编码向量进行向量映射,得到语音编码向量;基于音频信号生成子模型,对语音编码向量进行语音合成。本申请实施例能够提高合成语音特征的多样性。

【技术实现步骤摘要】

本申请涉及语音合成,适用于金融科技领域,尤其涉及一种语音合成方法和装置、电子设备及存储介质


技术介绍

1、语音合成是将文本信息转换为语音的人工智能技术,能够通过模拟或合成人声,使计算机能够“说话”,例如,在金融领域的场景中,通过将金融文件中的产品宣传文本转换为语音,便于存在文字阅读困难的用户可以通过听觉获知产品的宣传信息。

2、目前,常见的语音合成方法是利用训练好的语音合成模型对文本信息进行语音转换,得到合成语音,但是该方法生成的合成语音往往只具有模型训练时所使用语音样本的特征,使得合成语音的语音特征存在局限,因此,如何提高合成语音特征的多样性,成为了亟待解决的技术问题。


技术实现思路

1、本申请实施例的主要目的在于提出一种语音合成方法和装置、电子设备及存储介质,旨在提高合成语音特征的多样性。

2、为实现上述目的,本申请实施例的第一方面提出了一种语音合成方法,所述方法包括:

3、获取语音合成数据,其中,所述语音合成数据包括语音合成文本及目标音频数据;</p>

4、获取本文档来自技高网...

【技术保护点】

1.一种语音合成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述音频信号生成子模型,对所述语音编码向量进行语音合成,得到合成语音数据,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述目标语音特征提取子模型,对所述目标音频数据进行特征提取,得到目标音频特征向量,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述目标语音特征提取子模型,对所述目标音频数据进行编码,得到目标音频编码向量,包括:

5.根据权利要求3所述的方法,其特征在于,所述基于所述目标语音特征提取子模型,对所述目标...

【技术特征摘要】

1.一种语音合成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述音频信号生成子模型,对所述语音编码向量进行语音合成,得到合成语音数据,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述目标语音特征提取子模型,对所述目标音频数据进行特征提取,得到目标音频特征向量,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述目标语音特征提取子模型,对所述目标音频数据进行编码,得到目标音频编码向量,包括:

5.根据权利要求3所述的方法,其特征在于,所述基于所述目标语音特征提取子模型,对所述目标音频编码向量进行量化处理,得到所述目标音频特征向量,包括:

6.根据权利要求...

【专利技术属性】
技术研发人员:孙奥兰王健宗程宁
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1