一种合成语音的变奏方法、装置、电子设备及存储介质制造方法及图纸

技术编号：34248624 阅读：21 留言：0更新日期：2022-07-24 10:59

本发明专利技术公开了一种合成语音的变奏方法、装置、电子设备及存储介质，用于解决现有的合成语音层次感不够分明，生动性差的技术问题。本发明专利技术包括：获取预处理文本，并从所述预处理文本中识别自然段落；对所述自然段落进行调整，得到实际段落；依次计算相邻两个实际段落的相关性；生成所述实际段落的合成语音；获取所述合成语音中各所述实际段落的语言节奏；根据所述相关性对所述语言节奏进行调整，得到变奏合成语音。成语音。成语音。

A variation method, device, electronic device and storage medium of synthetic speech

全部详细技术资料下载

【技术实现步骤摘要】
一种合成语音的变奏方法、装置、电子设备及存储介质

[0001]本专利技术涉及语音变奏
，尤其涉及一种合成语音的变奏方法、装置、电子设备及存储介质。

技术介绍

[0002]语音合成，又称文语转换（Text to Speech）技术，能将任意文字信息实时转化为标准流畅的语音朗读出来，相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术，是中文信息处理领域的一项前沿技术，解决的主要问题就是如何将文字信息转化为可听的声音信息，也即让机器像人一样开口说话。这与传统的声音回放设备（系统）有着本质的区别。传统的声音回放设备（系统），如磁带录音机，是通过预先录制声音然后回放来实现“让机器说话”的。但这种方式无论是在内容、存储、传输或者方便性、及时性等方面都存在很大的限制。而通过计算机语音合成则可以在任何时候将任意文本转换成具有高自然度的语音，从而真正实现让机器“像人一样开口说话”。
[0003]在语音合成中，选择基本节奏是最重要的一个步骤，基本节奏一般是由文本的基调来决定的。然而，基于基调决定的基本节奏是比较稳定的，由此进行的语音合成而来的语音层次感不够分明，生硬而不生动。

技术实现思路

[0004]本专利技术提供了一种合成语音的变奏方法、装置、电子设备及存储介质，用于解决现有的合成语音层次感不够分明，生动性差的技术问题。
[0005]本专利技术提供了一种合成语音的变奏方法，包括：获取预处理文本，并从所述预处理文本中识别自然段落；对所述自然段落进行调整，得到实际...

【技术保护点】

【技术特征摘要】
1.一种合成语音的变奏方法，其特征在于，包括：获取预处理文本，并从所述预处理文本中识别自然段落；对所述自然段落进行调整，得到实际段落；依次计算相邻两个实际段落的相关性；生成所述实际段落的合成语音；获取所述合成语音中各所述实际段落的语言节奏；根据所述相关性对所述语言节奏进行调整，得到变奏合成语音。2.根据权利要求1所述的方法，其特征在于，所述获取预处理文本，并从所述预处理文本中识别自然段落的步骤，包括：获取预处理文本，并识别所述预处理文本中的换行键；基于所述换行键将所述预处理文本拆分为若干个自然段落。3.根据权利要求1所述的方法，其特征在于，所述对所述自然段落进行调整，得到实际段落的步骤，包括：判断每个所述自然段落是否只有一种场景；若否，根据场景拆分所述自然段落，生成实际段落；若是，判断相邻两个自然段落是否为同一种场景；若是，将同一个场景的相邻两个自然段落合并为同一个实际段落。4.根据权利要求1所述的方法，其特征在于，所述根据所述相关性对所述语言节奏进行调整，得到变奏合成语音的步骤，包括：遍历所有所述实际段落，依次将每个所述实际段落确定为当前调整段落；当当前调整段落与上一实际段落的相关性大于第一预设阈值时，调整所述当前调整段落的语言节奏，得到变奏段落；所述变奏段落具有若干个句子；确定所述变奏段落中相邻两个句子的句子相关性；当当前句子与上一句子的句子相关性大于第二预设阈值时，调整所述当前句子的语言节奏，得到句子调整节奏；采用所有实际段落中每个句子的句子调整节奏，生成变奏合成语音。5.根据权利要求4所述的方法，其特征在于，所述当当前调整段落与上一实际段落的段落相关性大于第一预设阈值时，调整所述当前调整段落的语言节奏，得到变奏段落的步骤，包括：当当前调整段落与上一实际段落的相关性大于第一预设阈值时，获取当前实际段落的第一段落调整指标与所述上一实际段落的第二段...

【专利技术属性】
技术研发人员：余勇，钟少恒，王翊，王佳骏，陈志刚，陈捷，曹小冬，吴启明，蔡勇超，林承勋，吕华良，丁铖，林家树，郭泽豪，符春造，方美明，陈瑾，李鸿盛，
申请(专利权)人：广东电网有限责任公司佛山供电局，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人