一种语音合成方法、系统及计算机设备技术方案

技术编号:26892964 阅读:36 留言:0更新日期:2020-12-29 16:14
本发明专利技术公开了一种语音合成方法,所述方法步骤如下:采集语音文件,构建语音数据库,语音数据库为同一汉字或词组不同语调的语音文件的集合;获取文本,将文本分割为若干个具有独立语义和语调的文本块,并将文本块转化为拼音序列;使语音文件与拼音序列之间产生映射关联,对语音文件进行预处理后确定语音文件的物理参数,对语音文件进行标注并导入到DCNN深度卷积网络模型中进行训练;将需要转化为语音的文本输入到DCNN深度卷积网络模型中,输出相应的声波文件。

【技术实现步骤摘要】
一种语音合成方法、系统及计算机设备
本专利技术涉及语音合成领域,具体涉及一种语音合成方法、系统及计算机设备。
技术介绍
语音合成是通过机械或者电子的方法产生人造语音的技术。文语转换技术隶属于语音合成的范畴,它将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语进行输出。现有的语音合成方法中,需要前期录制大量的音频,尽可能全的覆盖所有的音节音素,合成的声音机械感强、生硬,不够自然。
技术实现思路
为解决上述技术问题,本专利技术提供一种语音合成方法、系统及计算机设备。为解决上述技术问题,本专利技术采用如下技术方案:一种语音合成方法,所述方法步骤如下:步骤一:采集语音文件,构建语音数据库,语音数据库为同一汉字或词组不同语调的语音文件的集合;步骤二:获取文本,将文本分割为若干个具有独立语义和语调的文本块,并将文本块转化为拼音序列;步骤三:使语音文件与拼音序列之间产生映射关联,对语音文件进行预处理后确定语音文件的物理参数,对语音文件进行标注并导入到DCNN深度卷积网本文档来自技高网...

【技术保护点】
1.一种语音合成方法,其特征在于:所述方法步骤如下:/n步骤一:采集语音文件,构建语音数据库,语音数据库为同一汉字或词组不同语调的语音文件的集合;/n步骤二:获取文本,将文本分割为若干个具有独立语义和语调的文本块,并将文本块转化为拼音序列;/n步骤三:使语音文件与拼音序列之间产生映射关联,对语音文件进行预处理后确定语音文件的物理参数,对语音文件进行标注并导入到DCNN深度卷积网络模型中进行训练;/n步骤四:将需要转化为语音的文本输入到DCNN深度卷积网络模型中,输出相应的声波文件。/n

【技术特征摘要】
1.一种语音合成方法,其特征在于:所述方法步骤如下:
步骤一:采集语音文件,构建语音数据库,语音数据库为同一汉字或词组不同语调的语音文件的集合;
步骤二:获取文本,将文本分割为若干个具有独立语义和语调的文本块,并将文本块转化为拼音序列;
步骤三:使语音文件与拼音序列之间产生映射关联,对语音文件进行预处理后确定语音文件的物理参数,对语音文件进行标注并导入到DCNN深度卷积网络模型中进行训练;
步骤四:将需要转化为语音的文本输入到DCNN深度卷积网络模型中,输出相应的声波文件。


2.根据权利要求1所述的语音合成方法,其特征在于:步骤二中,通过文本输入的方式获取文本,并在文本输入时检测文本的正确性。


3.根据权利要求1所述的语音合成方法,其特征在于:步骤三中,对语音文件进行标注时,通过隐马尔可夫模型标注语音文件的声母、韵母和语调。


4.根据权利要求1所述的语音合成方法,其特征在于,进行步骤三之前,先将拼音序列以TF-IDF方式进行编码,生成拼音序列向量,继而使拼音序列向量具有固定长度:拼音序列向量超过该固定长度的,对其进行截取并舍弃其末尾;拼音序列向量短于该固定长度的,在其末尾补零填充;将具有固定长度的拼音序列向量作为拼音序列的特征向量。


5.根据权利要求1所述的语音合成方法,其特征在于,进行步骤三之...

【专利技术属性】
技术研发人员:钟生王鹏贾玮民
申请(专利权)人:中用科技有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1