【技术实现步骤摘要】
【国外来华专利技术】语音合成方法、装置、计算机设备及计算机可读存储介质
本专利技术涉及语言合成
,尤其涉及一种语音合成方法、装置、计算机设备及计算机可读存储介质。
技术介绍
语音合成是通过机械的、电子的方法产生人造语音的技术,具体是指将计算机自己产生的、或外部输入计算机的文字信息转变为可以听得懂的、流利的语音输出的技术。现有技术中,从参考的语音中提取情感特征,然后通过无监督的方式利用提取的情感特征来控制语音的风格,但是,语音中不止情感,还包括有重音等,需要对重音等韵律因素进行精细控制,从而使得合成的语音更加真实。
技术实现思路
基于此,有必要针对上述问题,提出了一种能够同时对情感和韵律进行控制的语音合成、装置、计算机设备及存储介质。本专利技术实施例提供了一种语音合成方法,所述方法包括:获取待合成频谱和预置频谱;根据所述待合成频谱和所述预置频谱得到叠加频谱;对所述叠加频谱进行情感语义特征提取得到所述叠加频谱对应的情感语义特征;对所述预置频谱进行基频提取,得到所述预置 ...
【技术保护点】
1.一种语音合成方法,其特征在于,所述方法包括:/n获取待合成频谱和预置频谱;/n根据所述待合成频谱和所述预置频谱得到叠加频谱;/n对所述叠加频谱进行情感语义特征提取得到所述叠加频谱对应的情感语义特征;/n对所述预置频谱进行基频提取,得到所述预置频谱对应的基频特征;/n根据所述叠加频谱对应的情感语义特征和所述预置频谱对应的基频特征得到所述待合成频谱对应的情感韵律频谱,以根据所述情感韵律频谱生成语音。/n
【技术特征摘要】
【国外来华专利技术】1.一种语音合成方法,其特征在于,所述方法包括:
获取待合成频谱和预置频谱;
根据所述待合成频谱和所述预置频谱得到叠加频谱;
对所述叠加频谱进行情感语义特征提取得到所述叠加频谱对应的情感语义特征;
对所述预置频谱进行基频提取,得到所述预置频谱对应的基频特征;
根据所述叠加频谱对应的情感语义特征和所述预置频谱对应的基频特征得到所述待合成频谱对应的情感韵律频谱,以根据所述情感韵律频谱生成语音。
2.根据权利要求1所述的方法,其特征在于,所述根据所述待合成频谱和所述预置频谱得到叠加频谱,包括:
将所述预置频谱作为情感编码器的输入,得到所述预置频谱对应的情感特征;
根据所述预置频谱对应的情感特征和所述待合成频谱得到所述叠加频谱。
3.根据权利要求2所述的方法,其特征在于,所述根据所述预置频谱对应的情感特征和所述待合成频谱得到所述叠加频谱,包括:
获取所述待合成频谱对应的待合成维度;
将所述预置频谱对应的情感特征转换成维度和所述待合成维度一致的情感转换特征;
根据所述待合成频谱和所述情感转换特征得到所述叠加频谱。
4.根据权利要求1所述的方法,其特征在于,所述对所述叠加频谱进行情感语义特征提取得到所述叠加频谱对应的情感语义特征,包括:
将所述叠加频谱作为情感语义编码器的输入,得到所述情感语义编码器输出的所述叠加频谱对应的情感语义特征。
5.根据权利要求4所述的方法,其特征在于,所述根据所述叠加频谱对应的情感语义特征和所述预置频谱对应的基频特征得到所述待合成频谱对应的情感韵律频谱,包括:
将所述叠加频谱对应的情感语义特征和所...
【专利技术属性】
技术研发人员:黄东延,盛乐园,熊友军,
申请(专利权)人:深圳市优必选科技股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。