当前位置: 首页 > 专利查询>清华大学专利>正文

语音合成方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:40903496 阅读:21 留言:0更新日期:2024-04-18 14:35
本发明专利技术提供一种语音合成方法、装置、电子设备及可读存储介质,其中的方法包括:获取用户给定的待合成文本,并对待合成文本进行编码处理,得到初始频谱表示;基于改进型生成模型,将初始频谱表示变换为目标频谱表示;对目标频谱表示进行分析合成处理,得到待合成文本对应的目标语音信号;其中,改进型生成模型基于对传统生成模型进行噪声时间表改进、采样算法改进以及网络参数化目标改进得到。该方法通过改进型生成模型对粗略的频谱表示进行变换,克服了现有语音合成方法的合成效率低下且合成质量不高的缺陷,极大地提升了合成语音信号的质量,还有效提升了语音信号的合成效率。

【技术实现步骤摘要】

本专利技术涉及语音合成,尤其涉及一种语音合成方法、装置、电子设备及可读存储介质


技术介绍

1、随着语音信号处理技术的发展,语音合成逐渐成为语音信号处理领域的重要研究分支,其中,最常见的语音合成的技术手段为基于tts(text to speech,从文本到语音)对语音进行合成,从文本到语音合成是一个典型的多模态生成任务,这一任务将给定的文本输入序列转化为具有不同说话者身份、情绪、风格的语音输出。

2、目前,主流的文本到语音合成系统主要文本前端、声学模型以及声码器三个部分组成,通过文本到语音合成系统可以实现对目标说话人的语音波形的构建。

3、然而,如何解决现有语音合成方法的合成效率低下,且合成质量不高的问题,是语音合成
亟待解决的重要课题。


技术实现思路

1、本专利技术提供一种语音合成方法、装置、电子设备及可读存储介质,用以克服现有语音合成方法的合成效率低下,且合成质量不高的缺陷,实现语音信号的快速、精确合成。

2、一方面,本专利技术提供一种语音合成方法,包括:获取用户本文档来自技高网...

【技术保护点】

1.一种语音合成方法,其特征在于,包括:

2.根据权利要求1所述的语音合成方法,其特征在于,所述改进型生成模型为改进型正向反向随机微分方程,所述改进型正向反向随机微分方程以所述初始频谱表示为输入,以所述目标频谱表示为输出。

3.根据权利要求2所述的语音合成方法,其特征在于,所述基于改进型生成模型,将所述初始频谱表示变换为目标频谱表示,包括:

4.根据权利要求3所述的语音合成方法,其特征在于,所述非对称噪声时间表与所述方差保留噪声时间表均为线性函数,其中,

5.根据权利要求3所述的语音合成方法,其特征在于,所述基于所述漂移系数和扩散系数,根据...

【技术特征摘要】

1.一种语音合成方法,其特征在于,包括:

2.根据权利要求1所述的语音合成方法,其特征在于,所述改进型生成模型为改进型正向反向随机微分方程,所述改进型正向反向随机微分方程以所述初始频谱表示为输入,以所述目标频谱表示为输出。

3.根据权利要求2所述的语音合成方法,其特征在于,所述基于改进型生成模型,将所述初始频谱表示变换为目标频谱表示,包括:

4.根据权利要求3所述的语音合成方法,其特征在于,所述非对称噪声时间表与所述方差保留噪声时间表均为线性函数,其中,

5.根据权利要求3所述的语音合成方法,其特征在于,所述基于所述漂移系数和扩散系数,根据改进型采样算法计算得到所述目标语音信号,包括:

【专利技术属性】
技术研发人员:朱军何冠德郑凯文
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1