语音合成方法、装置、计算机设备及计算机可读存储介质制造方法及图纸

技术编号：24043977 阅读：75 留言：0更新日期：2020-05-07 04:21

本发明专利技术实施例公开了一种语音合成方法、装置、计算机设备及计算机可读存储介质。本发明专利技术中语音合成方法，包括：根据获取待合成频谱和预置频谱得到叠加频谱；对叠加频谱进行情感语义特征提取；对预置频谱进行基频提取，得到预置频谱对应的基频特征；根据叠加频谱对应的情感语义特征和预置频谱对应的基频特征得到待合成频谱对应的情感韵律频谱。根据情感韵律频谱生成的语音，与待合成频谱具有相同的语义，并且与预置频谱的情感特征和韵律特征一致。上述语音合成方法，首先提取到了情感语义特征，赋予了语音情感，然后提取到了预置频谱的基频，而基频能够体现韵律，由此实现了对语音的重音等韵律进行控制，最终使得合成的语音更加真实。

Speech synthesis method, device, computer equipment and computer readable storage medium

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】语音合成方法、装置、计算机设备及计算机可读存储介质
本专利技术涉及语言合成
，尤其涉及一种语音合成方法、装置、计算机设备及计算机可读存储介质。
技术介绍
语音合成是通过机械的、电子的方法产生人造语音的技术，具体是指将计算机自己产生的、或外部输入计算机的文字信息转变为可以听得懂的、流利的语音输出的技术。现有技术中，从参考的语音中提取情感特征，然后通过无监督的方式利用提取的情感特征来控制语音的风格，但是，语音中不止情感，还包括有重音等，需要对重音等韵律因素进行精细控制，从而使得合成的语音更加真实。
技术实现思路
基于此，有必要针对上述问题，提出了一种能够同时对情感和韵律进行控制的语音合成、装置、计算机设备及存储介质。本专利技术实施例提供了一种语音合成方法，所述方法包括：获取待合成频谱和预置频谱；根据所述待合成频谱和所述预置频谱得到叠加频谱；对所述叠加频谱进行情感语义特征提取得到所述叠加频谱对应的情感语义特征；对所述预置频谱进行基频提取，得到所述预置...

【技术保护点】
1.一种语音合成方法，其特征在于，所述方法包括：/n获取待合成频谱和预置频谱；/n根据所述待合成频谱和所述预置频谱得到叠加频谱；/n对所述叠加频谱进行情感语义特征提取得到所述叠加频谱对应的情感语义特征；/n对所述预置频谱进行基频提取，得到所述预置频谱对应的基频特征；/n根据所述叠加频谱对应的情感语义特征和所述预置频谱对应的基频特征得到所述待合成频谱对应的情感韵律频谱，以根据所述情感韵律频谱生成语音。/n

【技术特征摘要】
【国外来华专利技术】1.一种语音合成方法，其特征在于，所述方法包括：
获取待合成频谱和预置频谱；
根据所述待合成频谱和所述预置频谱得到叠加频谱；
对所述叠加频谱进行情感语义特征提取得到所述叠加频谱对应的情感语义特征；
对所述预置频谱进行基频提取，得到所述预置频谱对应的基频特征；
根据所述叠加频谱对应的情感语义特征和所述预置频谱对应的基频特征得到所述待合成频谱对应的情感韵律频谱，以根据所述情感韵律频谱生成语音。

2.根据权利要求1所述的方法，其特征在于，所述根据所述待合成频谱和所述预置频谱得到叠加频谱，包括：
将所述预置频谱作为情感编码器的输入，得到所述预置频谱对应的情感特征；
根据所述预置频谱对应的情感特征和所述待合成频谱得到所述叠加频谱。

3.根据权利要求2所述的方法，其特征在于，所述根据所述预置频谱对应的情感特征和所述待合成频谱得到所述叠加频谱，包括：
获取所述待合成频谱对应的待合成维度；
将所述预置频谱对应的情感特征转换成维度和所述待合成维度一致的情感转换特征；
根据所述待合成频谱和所述情感转换特征得到所述叠加频谱。

4.根据权利要求1所述的方法，其特征在于，所述对所述叠加频谱进行情感语义特征提取得到所述叠加频谱对应的情感语义特征，包括：
将所述叠加频谱作为情感语义编码器的输入，得到所述情感语义编码器输出的所述叠加频谱对应的情感语义特征。

5.根据权利要求4所述的方法，其特征在于，所述根据所述叠加频谱对应的情感语义特征和所述预置频谱对应的基频特征得到所述待合成频谱对应的情感韵律频谱，包括：
将所述叠加频谱对应的情感语义特征和所...

【专利技术属性】
技术研发人员：黄东延，盛乐园，熊友军，
申请(专利权)人：深圳市优必选科技股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人