一种语音合成的方法、装置及电子设备制造方法及图纸

技术编号:17616400 阅读:117 留言:0更新日期:2018-04-04 07:25
本发明专利技术公开了一种语音合成的方法、装置及电子设备,该语音合成的方法包括:从固定成分文本的录音中提取固定成分文本音频的基频参数和幅度参数;根据所述幅度参数进行音频压限和滤波处理,获得固定成分文本音频的频谱参数;在合成语音时,基于待合成语音中的固定成分文本的基频参数和频谱参数合成语音。在上述技术方案中,通过音频压限和滤波处理使音频达到幅度更均衡及音频协调一致的效果,使得频谱参数达到与纯参数合成语音(非固定成分文本)的音色一致,再基于此固定成分文本的基频参数和频谱参数合成语音,其固定成分文本的音色与非固定成分文本一致,解决了现有技术中参数语音合成音色不一致的技术问题。

A method, device, and electronic device for speech synthesis

The invention discloses a method for speech synthesis device and electronic equipment, including the method of speech synthesis: extract the fundamental frequency parameter and the amplitude parameter fixed component of the text audio from a fixed component of the text recording; audio limiting and filtering processing parameters according to the amplitude spectrum parameters to get the fixed component of the text and audio in speech synthesis,; fundamental parameters and spectral parameters of synthetic speech text to speech synthesis in fixed composition based on. In the technical proposal, the pressure effect of the audio processing and filtering the audio and audio amplitude reached more balanced and coordinated, the spectral parameters to achieve the parameters of speech synthesis and pure (non fixed component text) tone, and pitch parameters and spectral parameters of speech synthesis based on the fixed component of the text, the fixed component of the text the tone and non fixed component of the text, to solve the parametric speech synthesis timbre inconsistency problem of the prior art.

【技术实现步骤摘要】
一种语音合成的方法、装置及电子设备
本专利技术涉及语音信号处理
,特别涉及一种语音合成的方法、装置及电子设备。
技术介绍
参数语音合成,是目前一种主流的语音合成技术。参数语音合成占用空间少、运算实时性高,在智能终端、嵌入式设备上广泛的应用前景。参数语音时由合成文本完成,合成文本通常由固定不变成分(即固定成分文本)及可变参数成分(即非固定成分文本)构成。现有技术中,语音合成时将固定成分文本通过预先录制自然语音的方式获取部分语音片断,对可变成分文本执行语音合成得到另一语音片断,然后将两断语音片断信号拼接获取到最后的连续语音信号。由于,自然语音和电子设备合成的合成语音之间音色存在较大差异,导致固定成分文本采用自然语音、非固定成分文本采用合成语音进行拼接合成的语音存在音色不一致的问题。可见,现有技术中参数语音合成存在音色不一致的技术问题。
技术实现思路
本专利技术实施例提供一种语音合成的方法、装置及电子设备,用于解决现有技术中参数语音合成存在音色不一致的技术问题。本申请实施例提供一种语音合成的方法,所述方法包括:从固定成分文本的录音中提取固定成分文本音频的基频参数和幅度参数;根据所述幅度参本文档来自技高网...
一种语音合成的方法、装置及电子设备

【技术保护点】
一种语音合成的方法,其特征在于,所述方法包括:从固定成分文本的录音中提取固定成分文本音频的基频参数和幅度参数;根据所述幅度参数进行音频压限和滤波处理,获得固定成分文本音频的频谱参数;在合成语音时,基于待合成语音中的固定成分文本的基频参数和频谱参数合成语音。

【技术特征摘要】
1.一种语音合成的方法,其特征在于,所述方法包括:从固定成分文本的录音中提取固定成分文本音频的基频参数和幅度参数;根据所述幅度参数进行音频压限和滤波处理,获得固定成分文本音频的频谱参数;在合成语音时,基于待合成语音中的固定成分文本的基频参数和频谱参数合成语音。2.如权利要求1所述的方法,其特征在于,所述根据所述幅度参数进行音频压限和滤波处理,获得固定成分文本音频的频谱参数,包括:针对所述幅度参数进行归一化处理,并将归一化处理后的参数转换为分贝值序列;针对所述分贝值序列进行音频压限处理;对音频压限处理后的音频幅度进行幅度反归一化获得处理后的幅度参数;根据所述处理后的幅度参数进行滤波处理获得所述频谱参数。3.如权利要求2所述的方法,其特征在于,所述针对所述幅度参数进行归一化处理,包括:根据如下公式对所述幅度参数进行归一化处理,并获得归一处理后的参数y1:其中,scale表示归一化系数,y表示所述幅度参数,n表示所述固定成分文本音频的量化位数。4.如权利要求2所述的方法,其特征在于,所述将归一化处理后的参数转换为分贝值序列,包括:根据如下公式将所述归一化处理后的参数中的每一个点x1转换成对应的分贝值y2:y2=20*log10(abs(x1))由所有的y2构成所述分贝值序列。5.如权利要求2所述的方法,其特征在于,所述针对所述分贝值序列进行音频压限处理,包括:通过如下公式对所述分贝值序列中的每一个分贝值进行处理:其中,ratio表示压限比例,0<ratio<1,border表示压限的边界值,y2表示所述分值序列中的一个分贝值,y3表示压限获得的目标分贝值。6.如权利要求2所述的方法,其特征在于,所述对音频压限处理后的目标分贝值进行幅度...

【专利技术属性】
技术研发人员:宋阳
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1