语音生成方法、装置、电子设备以及存储介质制造方法及图纸

技术编号:46622712 阅读:0 留言:0更新日期:2025-10-14 21:17
本公开实施例提供了一种语音生成方法、装置、电子设备以及存储介质。该方法包括:确定目标文本所采用的参考方言类型,基于参考方言类型对目标文本进行注音解析、韵律解析与分词解析得到目标文本对应的目标文本描述信息;基于目标文本描述信息、参考方言类型与参考音色进行方言迁移得到目标语音。本申请通过根据参考方言类型对目标文本进行注音解析、韵律解析与分词解析得到目标文本描述信息,从而保证目标文本描述信息符合对目标文本进行方言迁移时所需的文本信息,进一步再基于目标文本描述信息、参考方言类型与参考音色将目标文本进行方言迁移生成目标语音,解决了方言和普通话的音素或语调互串合成出现发音不标准等问题,提高方言生成效果。

【技术实现步骤摘要】

本公开实施例涉及语音处理,尤其涉及一种语音生成方法、装置、电子设备以及存储介质


技术介绍

1、各地的方言在用词习惯上有所差异,即使同属一个语言体系,不同方言之间也存在较大区别。这种差异主要体现在相同词汇的拼音不同,导致通用语使用者与方言使用者、不同方言使用者之间的沟通存在困难。

2、在方言迁移的相关方案中,包括用语言id区分普通话和方言,使用ipa音素代替语言学音素,以及混合普通话数据和方言数据进行训练等。但是,这些方案存在方言发音稳定性问题,容易将方言和普通话的音素或语调互串合成以及出现发音不标准等问题,导致方言生成的效果不佳。


技术实现思路

1、本公开提供一种语音生成方法、装置、电子设备以及存储介质,以解决方言和普通话的音素或语调互串合成出现发音不标准等问题,提高方言生成效果。

2、第一方面,本公开实施例提供了一种语音生成方法,所述方法包括:

3、确定目标文本所采用的参考方言类型,所述参考方言类型为针对目标文本进行方言迁移时所期望生成的方言类型;</p>

4、基于本文档来自技高网...

【技术保护点】

1.一种语音生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述注音解析包括音素解析与音调解析,按照不同方言类型对相同的文本进行注音解析、韵律解析与分词解析后得到的解析结果存在差异性。

3.根据权利要求2所述的方法,其特征在于,基于所述参考方言类型对目标文本进行注音解析、韵律解析与分词解析得到所述目标文本对应的目标文本描述信息,包括:

4.根据权利要求1所述的方法,其特征在于,基于目标文本描述信息、参考方言类型与参考音色进行方言迁移得到目标语音,包括:

5.根据权利要求4所述的方法,其特征在于,基于目标文本描...

【技术特征摘要】

1.一种语音生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述注音解析包括音素解析与音调解析,按照不同方言类型对相同的文本进行注音解析、韵律解析与分词解析后得到的解析结果存在差异性。

3.根据权利要求2所述的方法,其特征在于,基于所述参考方言类型对目标文本进行注音解析、韵律解析与分词解析得到所述目标文本对应的目标文本描述信息,包括:

4.根据权利要求1所述的方法,其特征在于,基于目标文本描述信息、参考方言类型与参考音色进行方言迁移得到目标语音,包括:

5.根据权利要求4所述的方法,其特征在于,基于目标文本描述信息、参考方言类型与参考音色,通过预设方言迁移模型执行方言迁移任务得到目标梅尔频谱信息,包括:

6.根据权利要求5所述的方法,其特征在于,基于目标文本描述信息与参考方言类型,通过预设方言迁移模型生成目标文本描述信息对应的目标文本特征...

【专利技术属性】
技术研发人员:章峻珲
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1