一种语音合成方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：34201848 阅读：15 留言：0更新日期：2022-07-20 10:52

本发明专利技术公开了一种语音合成方法、装置、计算机设备和存储介质。该方法包括：获取待语音合成文本，并将待语音合成文本分割为多个文本片段；按照各文本片段在所述待语音合成文本中的先后顺序，对各所述文本片段进行语音合成，得到各文本片段匹配的语音片段；在对各所述文本片段进行语音合成的过程中，按照各所述语音片段的合成顺序，对各所述语音片段进行播放。使用本发明专利技术的技术方案，可以实现在保证语音合成效果的同时，提高语音合成的效率。提高语音合成的效率。提高语音合成的效率。

A speech synthesis method, device, computer equipment and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
一种语音合成方法、装置、计算机设备和存储介质

[0001]本专利技术实施例涉及数据处理技术，尤其涉及一种语音合成方法、装置、计算机设备和存储介质。

技术介绍

[0002]语音合成是指将文字信息转换为语音输出的技术，语音合成系统分为在线语音合成和离线语音合成，在线语音合成由部署在服务器中的语音合成模型来实现，离线语音合成由部署在终端设备上的语音合成模型来实现。
[0003]由于终端设备的算力要远远低于服务器，将语音合成模型部署到终端设备时，需要降低其算法复杂度，因此，离线语音合成模型合成语音的效果较差，例如，合成出来的语音会丢失情感、抑扬顿挫等特征。并且，对于较长的语句，需要耗费较长的时间。

技术实现思路

[0004]本专利技术实施例提供一种语音合成方法、装置、计算机设备和存储介质，以实现在保证语音合成效果的同时，提高语音合成的效率。
[0005]第一方面，本专利技术实施例提供了一种语音合成方法，该方法包括：
[0006]获取待语音合成文本，并将待语音合成文本分割为多个文本片段；
[0007]按照各文本片段在所述待语音合成文本中的先后顺序，对各所述文本片段进行语音合成，得到各文本片段匹配的语音片段；
[0008]在对各所述文本片段进行语音合成的过程中，按照各所述语音片段的合成顺序，对各所述语音片段进行播放。
[0009]第二方面，本专利技术实施例还提供了一种语音合成装置，该装置包括：
[0010]待语音合成文本分割模块，用于获取待语音合成文本，并将...

【技术保护点】

【技术特征摘要】
1.一种语音合成方法，其特征在于，包括：获取待语音合成文本，并将待语音合成文本分割为多个文本片段；按照各文本片段在所述待语音合成文本中的先后顺序，对各所述文本片段进行语音合成，得到各文本片段匹配的语音片段；在对各所述文本片段进行语音合成的过程中，按照各所述语音片段的合成顺序，对各所述语音片段进行播放。2.根据权利要求1所述的方法，其特征在于，在将待语音合成文本分割为多个文本片段之后，还包括：将分割得到的各所述文本片段依次存储于文本片段队列中；按照各文本片段在所述待语音合成文本中的先后顺序，对各所述文本片段进行语音合成，包括：从所述文本片段队列中依次获取各所述文本片段，并分别对获取的各所述文本片段进行语音合成。3.根据权利要求1所述的方法，其特征在于，在得到各文本片段匹配的语音片段之后，还包括：将各语音片段依次存储于语音片段队列中；按照各所述语音片段的合成顺序，对各所述语音片段进行播放，包括：从所述语音片段队列中依次获取各所述语音片段，并分别对获取的各所述语音片段进行播放。4.根据权利要求1所述的方法，其特征在于，获取待语音合成文本，并将待语音合成文本分割为多个文本片段，包括：通过语义分析模型，将待语音合成文本根据文本分割规则进行分割，获得多个文本片段；其中，所述文本分割规则包括以下至少一项：标点符号分割规则、语种分割规则以及词义分割规则。5.根据权利要求2所述的方法，其特征在于，所述从所述文本片段队列中依次获取各所述文本片段，并分别对获取的各所述文本片段进行语音合成，包括：通过离线语音合成模型，在所述文本片段队列中依次获取文本片段，并对获取的各文本片段进行离线语音合成，生成与各文本片段匹配的语音片段。6.根据权利要求5所述的方法，其特征在于，在将待语音合成文本分割为多个文本片段之后，还包括：根据各文本片段对应的语种类型，生成各文本片段的语种标签，将各文本片段以及对应的语种标签依次放入文本片段队列中；从所述文本片段队列中依次获取各所述文本片段，并分别对获取的各所述文本片段进行语音合成，包括：在文本片段队列中依次获取各文本片段，根据各文本片段对应的语种标签确定匹配的离线语音合成模型，并通过与文本片段匹配的离线语音合成模型进行语音合成。7.根据权利要求6所述的方法，其特征在于，所述离线语音合成模型中包括情感分析模块；
所述通过与文本片段匹配的离线语音合成模型进行语音合成，包括：通过与文本片段匹配的离线语音合成模型中的情感分析模块，依次对各文本片段进行情感分析；根据各文本片段的情感分析结果，对各文本片段进行离线语音合成...

【专利技术属性】
技术研发人员：丁雪枫，
申请(专利权)人：大众问问北京信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人