语音合成方法、装置、可读介质及电子设备制造方法及图纸

技术编号:27659045 阅读:35 留言:0更新日期:2021-03-12 14:25
本公开涉及一种语音合成方法、装置、可读介质及电子设备,涉及电子信息处理技术领域,该方法包括:获取待合成文本和指定情感类型,确定指定情感类型对应的指定声学特征,将待合成文本和指定声学特征输入预先训练的语音合成模型,以获取语音合成模型输出的,待合成文本对应的具有指定情感类型的目标音频,目标音频的声学特征与指定声学特征匹配,语音合成模型为根据不具有指定情感类型的语料训练得到的。本公开能够通过情感类型对应的声学特征来控制对文本的语音合成,使得语音合成模型输出的目标音频能够与声学特征对应,提高了目标音频的表现力。

【技术实现步骤摘要】
语音合成方法、装置、可读介质及电子设备
本公开涉及电子信息处理
,具体地,涉及一种语音合成方法、装置、可读介质及电子设备。
技术介绍
随着电子信息处理技术的不断发展,语音作为人们获取信息的重要载体,已经被广泛应用于日常生活和工作中。涉及语音的应用场景中,通常会包括语音合成的处理,语音合成是指将用户指定的文本,合成为音频。语音合成过程中,需要借助原始音库来生成文本对应的音频。原始音库中的数据通常是不具有情感的,相应的,语音合成处理得到的音频也不具有情感,音频的表现力较弱。要使语音合成得到的音频具有情感,就需要创建具有情感的音库,对于录音人员来说工作量大、效率低,很难实现。
技术实现思路
提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。第一方面,本公开提供一种语音合成方法,所述方法包括:获取待合成文本和指定情感类型;确定所述指定情感类型对应本文档来自技高网...

【技术保护点】
1.一种语音合成方法,其特征在于,所述方法包括:/n获取待合成文本和指定情感类型;/n确定所述指定情感类型对应的指定声学特征;/n将所述待合成文本和所述指定声学特征输入预先训练的语音合成模型,以获取所述语音合成模型输出的,所述待合成文本对应的具有所述指定情感类型的目标音频,所述目标音频的声学特征与所述指定声学特征匹配,所述语音合成模型为根据不具有所述指定情感类型的语料训练得到的。/n

【技术特征摘要】
1.一种语音合成方法,其特征在于,所述方法包括:
获取待合成文本和指定情感类型;
确定所述指定情感类型对应的指定声学特征;
将所述待合成文本和所述指定声学特征输入预先训练的语音合成模型,以获取所述语音合成模型输出的,所述待合成文本对应的具有所述指定情感类型的目标音频,所述目标音频的声学特征与所述指定声学特征匹配,所述语音合成模型为根据不具有所述指定情感类型的语料训练得到的。


2.根据权利要求1所述的方法,其特征在于,所述指定声学特征包括:基频、音量、语速中的至少一种,所述确定所述指定情感类型对应的指定声学特征,包括:
根据所述指定情感类型,和预设的情感类型与声学特征的关联关系,确定对应的所述指定声学特征。


3.根据权利要求1或2所述的方法,其特征在于,所述语音合成模型用于:
通过所述待合成文本获得所述待合成文本对应的文本特征,和所述待合成文本对应的预测声学特征;
通过所述指定声学特征、所述预测声学特征和所述文本特征,获得具有所述指定情感类型的所述目标音频。


4.根据权利要求3所述的方法,其特征在于,所述语音合成模型包括:第一编码器、第二编码器和合成器;
所述将所述待合成文本和所述指定声学特征输入预先训练的语音合成模型,以获取所述语音合成模型输出的,所述待合成文本对应的具有所述指定情感类型的目标音频,包括:
通过所述第一编码器,提取所述待合成文本对应的所述文本特征;
通过所述第二编码器,提取所述待合成文本对应的所述预测声学特征;
通过所述合成器,根据所述指定声学特征、所述预测声学特征和所述文本特征,生成所述目标音频。


5.根据权利要求4所述的方法,其特征在于,所述文本特征包括多个文本元素,通过所述合成器,根据所述指定声学特征、所述预测声学特征和所述文本特征,生成所述目标音频,包括:
通过所述合成器,根据当前文本元素、历史梅尔频谱特征、所述指定声学特征和所述预测声学特征,确定当前时刻的梅尔频谱特征,所述当前文本元素为所述文本特征中当前时刻输入到所述合成器的文本元素,所述历史梅尔频谱特征为所述合成器确定的上一时刻的梅尔频谱特征;
通过所述合成器,根据每个时刻的梅尔频谱特征,生成所述目标音频。


6.根据权利要求3所述的方法,其特征在于,所述语音合成模型是通过如下方式训练获得的:
通过训练文本对应的不具有所述指定情感类型的训练音频,提取所述训练音频对应的真实声学特征;
将所述真实声学特征与所述训练文本...

【专利技术属性】
技术研发人员:潘俊杰
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1