一种语音合成方法、系统及计算机设备技术方案

技术编号：26892964 阅读：36 留言：0更新日期：2020-12-29 16:14

本发明专利技术公开了一种语音合成方法，所述方法步骤如下：采集语音文件，构建语音数据库，语音数据库为同一汉字或词组不同语调的语音文件的集合；获取文本，将文本分割为若干个具有独立语义和语调的文本块，并将文本块转化为拼音序列；使语音文件与拼音序列之间产生映射关联，对语音文件进行预处理后确定语音文件的物理参数，对语音文件进行标注并导入到DCNN深度卷积网络模型中进行训练；将需要转化为语音的文本输入到DCNN深度卷积网络模型中，输出相应的声波文件。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音合成方法、系统及计算机设备
本专利技术涉及语音合成领域，具体涉及一种语音合成方法、系统及计算机设备。
技术介绍
语音合成是通过机械或者电子的方法产生人造语音的技术。文语转换技术隶属于语音合成的范畴，它将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语进行输出。现有的语音合成方法中，需要前期录制大量的音频，尽可能全的覆盖所有的音节音素，合成的声音机械感强、生硬，不够自然。
技术实现思路
为解决上述技术问题，本专利技术提供一种语音合成方法、系统及计算机设备。为解决上述技术问题，本专利技术采用如下技术方案：一种语音合成方法，所述方法步骤如下：步骤一：采集语音文件，构建语音数据库，语音数据库为同一汉字或词组不同语调的语音文件的集合；步骤二：获取文本，将文本分割为若干个具有独立语义和语调的文本块，并将文本块转化为拼音序列；步骤三：使语音文件与拼音序列之间产生映射关联，对语音文件进行预处理后确定语音文件的物理参数，对语音文件进行标注并导入...

【技术保护点】
1.一种语音合成方法，其特征在于：所述方法步骤如下：/n步骤一：采集语音文件，构建语音数据库，语音数据库为同一汉字或词组不同语调的语音文件的集合；/n步骤二：获取文本，将文本分割为若干个具有独立语义和语调的文本块，并将文本块转化为拼音序列；/n步骤三：使语音文件与拼音序列之间产生映射关联，对语音文件进行预处理后确定语音文件的物理参数，对语音文件进行标注并导入到DCNN深度卷积网络模型中进行训练；/n步骤四：将需要转化为语音的文本输入到DCNN深度卷积网络模型中，输出相应的声波文件。/n

【技术特征摘要】
1.一种语音合成方法，其特征在于：所述方法步骤如下：
步骤一：采集语音文件，构建语音数据库，语音数据库为同一汉字或词组不同语调的语音文件的集合；
步骤二：获取文本，将文本分割为若干个具有独立语义和语调的文本块，并将文本块转化为拼音序列；
步骤三：使语音文件与拼音序列之间产生映射关联，对语音文件进行预处理后确定语音文件的物理参数，对语音文件进行标注并导入到DCNN深度卷积网络模型中进行训练；
步骤四：将需要转化为语音的文本输入到DCNN深度卷积网络模型中，输出相应的声波文件。

2.根据权利要求1所述的语音合成方法，其特征在于：步骤二中，通过文本输入的方式获取文本，并在文本输入时检测文本的正确性。

3.根据权利要求1所述的语音合成方法，其特征在于：步骤三中，对语音文件进行标注时，通过隐马尔可夫模型标注语音文件的声母、韵母和语调。

4.根据权利要求1所述的语音合成方法，其特征在于，进行步骤三之前，先将拼音序列以TF-IDF方式进行编码，生成拼音序列向量，继而使拼音序列向量具有固定长度：拼音序列向量超过该固定长度的，对其进行截取并舍弃其末尾；拼音序列向量短于该固定长度的，在其末尾补零填充；将具有固定长度的拼音序列向量作为拼音序列的特征向量。

5.根据权利要求1所述的语音合成方法，其特征在于，进行步骤三之...

【专利技术属性】
技术研发人员：钟生，王鹏，贾玮民，
申请(专利权)人：中用科技有限公司，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人