一种基于风格的语音转换方法、装置、设备及介质制造方法及图纸

技术编号:42399233 阅读:20 留言:0更新日期:2024-08-16 16:21
本发明专利技术涉及人工智能技术领域,尤其涉及一种基于风格的语音转换方法、装置、设备及介质。上述方法应用于银行场景一致化服务中,获取待转换的源语音,提取源语音的音素序列与情感特征,根据音素序列与源梅尔频谱,得到对齐后的文本编码特征,获取参考语音,提取参考语音中的风格特征,将对齐后的文本编码特征、情感特征与风格特征进行特征融合,得到第一融合特征,对第一融合特征进行特征解码,得到解码后的梅尔频谱,将解码后的梅尔频谱合成语音,通过将文本编码特征与源语音的情感特征,以及参考语音中的风格特征直接输入至解码器中进行特征解码,得到解码后的梅尔频谱,合成转换后的语音,提高了语音转换效率。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及一种基于风格的语音转换方法、装置、设备及介质


技术介绍

1、在科技的推动下,银行业务逐渐线上化。而如何更好地以客户为中心,为客户带来更安全、更高效的客户体验,将成为交易银行转型的重心。银行通过拓展服务场景为客户提供更极致、更创新的服务新体验,在同一场景中,一般需要进行一致化服务,将对应的客服语音转换为规定的目标语音。现有技术中,通过语音转换模型进行语音转换,语音转换模型一般包括,文本编码器、样式编码器、鉴别器、文本对齐器、音调提取器、语音解码器、持续时间预测器和韵律预测器八个模块,在进行语音转换时,使得语音转换效率较低,因此,在银行服务场景中的一致化服务过程中,如何提高语音转换效率成为亟需解决的问题。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种基于风格的语音转换方法、装置、设备及存储介质,以解决语音转换效率较低的问题。

2、本申请实施例的第一方面提供了一种基于风格的语音转换方法,所述的语音转换方法包括:

3、获取待转换的源语音,提取所述本文档来自技高网...

【技术保护点】

1.一种基于风格的语音转换方法,其特征在于,所述语音转换方法包括:

2.如权利要求1所述的语音转换方法,其特征在于,所述对所述源梅尔频谱进行情感特征提取,得到所述源梅尔频谱对应的情感特征,包括:

3.如权利要求2所述的语音转换方法,其特征在于,所述将所述音高特征与所述能量特征相加融合,得到第二融合特征,确定所述第二融合特征为情感特征,包括:

4.如权利要求1所述的语音转换方法,其特征在于,所述对所述参考梅尔频谱进行风格特征提取,得到所述参考梅尔频谱对应的风格特征,包括:

5.如权利要求1所述的语音转换方法,其特征在于,所述将所述对齐后的文本...

【技术特征摘要】

1.一种基于风格的语音转换方法,其特征在于,所述语音转换方法包括:

2.如权利要求1所述的语音转换方法,其特征在于,所述对所述源梅尔频谱进行情感特征提取,得到所述源梅尔频谱对应的情感特征,包括:

3.如权利要求2所述的语音转换方法,其特征在于,所述将所述音高特征与所述能量特征相加融合,得到第二融合特征,确定所述第二融合特征为情感特征,包括:

4.如权利要求1所述的语音转换方法,其特征在于,所述对所述参考梅尔频谱进行风格特征提取,得到所述参考梅尔频谱对应的风格特征,包括:

5.如权利要求1所述的语音转换方法,其特征在于,所述将所述对齐后的文本编码特征、所述情感特征与所述风格特征进行特征融合,得到第一融合特征,包括...

【专利技术属性】
技术研发人员:张旭龙王健宗程宁夏晶
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1