一种语音合成的方法、装置、计算设备及计算机存储介质制造方法及图纸

技术编号：20972335 阅读：23 留言：0更新日期：2019-04-29 17:47

本发明专利技术涉及语音信号处理及语音合成技术领域，尤其公开了一种语音合成的方法、装置、计算设备及计算机存储介质，其中，方法包括：接收用户输入的文本信息；将所述文本信息拆分为分句；生成所述分句对应的拼音码；将所述拼音码输入预设深度学习模型中，得到相应的合成语音。由此可见，利用本发明专利技术方案，可以减少语料库中的文本量，方便快捷的实现语音合成。

A Method, Device, Computing Equipment and Computer Storage Media for Speech Synthesis

The invention relates to the field of speech signal processing and speech synthesis technology, in particular to a speech synthesis method, device, computing device and computer storage medium, in which the method includes: receiving text information input by the user; dividing the text information into clauses; generating the corresponding pinyin codes for the clauses; and inputting the Pinyin codes into the preset deep learning model. The corresponding synthetic speech is obtained. Thus, the scheme of the invention can reduce the amount of text in the corpus and realize speech synthesis conveniently and quickly.

全部详细技术资料下载

【技术实现步骤摘要】
一种语音合成的方法、装置、计算设备及计算机存储介质
本专利技术实施例涉及语音信号处理及语音合成
，特别是涉及一种语音合成的方法、装置、计算设备及计算机存储介质。
技术介绍
语音合成，又称文语转换技术，能将任意文字信息实时转化为标准流畅的语音朗读出来，相当于给机器装上了人工嘴巴。它是中文信息处理领域的一项前沿技术，解决的主要问题就是如何将文字信息转化为可听的声音信息，也即让机器像人一样开口说话。本专利技术的专利技术人在实现本专利技术的过程中，发现：现有技术中，语音合成技术通过词语直接匹配语音，所需的语料库会十分庞大。
技术实现思路
鉴于上述问题，提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种语音合成的方法、装置、计算设备及计算机存储介质。为解决上述技术问题，本专利技术实施例采用的一个技术方案是：提供一种语音合成的方法，包括：接收用户输入的文本信息；将所述文本信息拆分为分句；生成所述分句对应的拼音码；将所述拼音码输入预设深度学习模型中，得到相应的合成语音。其中，所述将所述文本信息拆分为分句包括：识别所述文本信息中的标点符号；根据所述标点符号位置将所述文本信息拆分为分句。其中，所述生成所述分句对应的拼音码，包括：使用预设分词算法将所述分句拆分为分词；识别所述分词中的多音字、数字及特殊字符；将所述数字及特殊字符按照读音转换为相应的汉字；使用预设语义理解算法确定所述多音字的读音，并按照读音将所述多音字转换为相应发音的其他汉字；将转换之后的分词合成为新的分句；使用预设生成算法将所述新的分句生成对应的拼音码。其中，所述预设深度学习模型是通过输...

【技术保护点】
1.一种语音合成的方法，其特征在于，包括：接收用户输入的文本信息；将所述文本信息拆分为分句；生成所述分句对应的拼音码；将所述拼音码输入预设深度学习模型中，得到相应的合成语音。

【技术特征摘要】
1.一种语音合成的方法，其特征在于，包括：接收用户输入的文本信息；将所述文本信息拆分为分句；生成所述分句对应的拼音码；将所述拼音码输入预设深度学习模型中，得到相应的合成语音。2.根据权利要求1所述的方法，其特征在于，所述将所述文本信息拆分为分句包括：识别所述文本信息中的标点符号；根据所述标点符号位置将所述文本信息拆分为分句。3.根据权利要求1或2所述的方法，其特征在于，所述生成所述分句对应的拼音码，包括：使用预设分词算法将所述分句拆分为分词；识别所述分词中的多音字、数字及特殊字符；将所述数字及特殊字符按照读音转换为相应的汉字；使用预设语义理解算法确定所述多音字的读音，并按照读音将所述多音字转换为相应发音的其他汉字；将转换之后的分词合成为新的分句；使用预设生成算法将所述新的分句生成对应的拼音码。4.根据权利要求1-3任意一项所述的方法，其特征在于，所述预设深度学习模型是通过输入文本信息对应的拼音码及所述文本信息对应的语音训练出来的模型。5.一种语音合成装置，其特征在于，包括：接收模块：用于接收用户输入的文本信息；拆分模块：用于将所述文本信息拆分成分句；生成模块：用于生成所述分句对应的拼音码；合成模块：用于将所述拼音码输入预设深度学习模型中，得到相应的合成语音。6.根据权利要求5所述的装置，其特征在于，所述拆分模...

【专利技术属性】
技术研发人员：徐建明，
申请(专利权)人：深圳前海达闼云端智能科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人