一种语音合成方法、装置、终端设备和存储介质制造方法及图纸

技术编号：42817998 阅读：20 留言：0更新日期：2024-09-24 20:57

本申请提供一种语音合成方法、装置、终端设备和存储介质，其方法包括：获取待合成文本，并对待合成文本进行分词处理，得到待合成分词和待合成短语；根据待合成分词和待合成短语分别确定出对应的音素；若第一预设存储空间中的梅尔频谱的第一数据量小于或等于第一数量阈值，则根据音素确定出对应的梅尔频谱；否则，停止根据音素确定出对应的梅尔频谱的步骤；若第二预设存储空间中的音频数据的第二数据量小于或等于第二数量阈值，则根据梅尔频谱确定出对应的音频数据；否则，停止根据梅尔频谱确定出对应的音频数据的步骤。本方法能够在保障语音合成的实时性的基础上，减少存储资源和计算资源的占用。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及语音处理，尤其涉及一种语音合成方法、装置、终端设备和存储介质。

技术介绍

1、语音合成指的是将输入的文本转成可播放的音频数据的过程。随着语音合成技术的快速发展，目前通过神经网络实现语音合成的技术已逐渐广泛应用。

2、基于神经网络进行语音合成，能够得出更加自然的声音，但也需要更多的存储资源和计算资源。目前的技术方案中，仅仅考虑到语音合成的实时性，因此不断增加存储资源和计算资源用于语音合成，这将造成存储资源和计算资源的浪费。

3、因此，如何在保障语音合成的实时性的基础上，减少存储资源和计算资源的占用，是本领域技术人员目前需要解决的技术问题。

技术实现思路

1、本申请的目的在于提供一种语音合成方法、装置、终端设备和计算机可读存储介质，能够在保障语音合成的实时性的基础上，减少存储资源和计算资源的占用。

2、第一方面，本申请提供了一种语音合成方法。所述方法包括：

3、获取待合成文本，并对所述待合成文本进行分词处理，得到待合成分词和待合成短语；

4、根本文档来自技高网...

【技术保护点】

1.一种语音合成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述音素确定出对应的梅尔频谱，包括：

3.根据权利要求1所述的方法，其特征在于，所述根据所述梅尔频谱确定出对应的音频数据，包括：

4.根据权利要求1所述的方法，其特征在于，所述若第一预设存储空间中的梅尔频谱的第一数据量小于或等于第一数量阈值，则根据所述音素确定出对应的梅尔频谱，包括：

5.根据权利要求1所述的方法，其特征在于，所述若第二预设存储空间中的音频数据的第二数据量小于或等于第二数量阈值，则根据所述梅尔频谱确定出对应的音频数据，包括：<...

【技术特征摘要】

1.一种语音合成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述音素确定出对应的梅尔频谱，包括：

3.根据权利要求1所述的方法，其特征在于，所述根据所述梅尔频谱确定出对应的音频数据，包括：

5.根据权利要求1所述的方法，其特征在于，所述若第二预设存储空间中的音频数据的第二数据量小于或等于第二数量阈值，则根据所述梅尔频谱确定出对应的音频数据，包括：

6.根据权利...

【专利技术属性】
技术研发人员：张大飞，
申请(专利权)人：深圳市锐明技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人