语音转换方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:43656908 阅读:11 留言:0更新日期:2024-12-13 12:49
本申请公开了一种语音转换方法、装置、计算机设备及存储介质。获取待转换的原始语音数据;将原始语音数据输入至预训练的语音转换模型的前置编码器,前置编码器对原始语音数据进行特征提取,输出原始语音数据对应的第一内容信息;获取语音转换对应的目标对象的目标梅尔图谱,将目标梅尔图谱输入至语音转换模型的说话人编码器,说话人编码器解析目标梅尔图谱,输出目标对象对应的第一音色信息;将第一内容信息和第一音色信息输入至语音转换模型的译码器,译码器解析第一内容信息和第一音色信息,输出转换后的目标语音数据。能够实时将当前的原始语音数据准确、快速转换为任意目标用户的目标语音数据。

【技术实现步骤摘要】

本申请涉及语音处理技术,应用于金融领域,尤其涉及一种语音转换方法、装置、设备及存储介质。


技术介绍

1、在金融领域提供金融服务时,例如信用卡用户服务查询以及查账单和其余日常需要语音电话交互的服务场景中,通过向用户提供专属客服的服务,即每次接打电话的声音都是用户对应的指定客服的说话声音能够大幅提升用户的使用体验和满意度。

2、但是目前的语音转换方法需要通过模型逐帧处理输入语音,导致模型的推理速度较慢。而对于金融客服这一实时问答场景过程中对语音的转换速度具有较高的要求,现有的方法在实时语音转换过程中存在忽略说话者特定的细节,生成的语音质量相对较差,导致用户的使用体验不甚理想。


技术实现思路

1、本申请提供了一种语音转换方法、装置、计算机设备及存储介质,旨在解决由于金融客服这一实时问答场景过程中对语音的转换速度具有较高的要求,现有的方法在实时语音转换过程中存在忽略说话者特定的细节,生成的语音质量相对较差,导致用户的使用体验不甚理想的问题。

2、第一方面,本申请提供了一种语音转换方法,包括:<本文档来自技高网...

【技术保护点】

1.一种语音转换方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在将所述原始语音数据输入至预训练的语音转换模型的前置编码器之前,还包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述训练语音数据和所述原始语音数据完成对所述语音转换模型的训练,包括:

4.根据权利要求1所述的方法,其特征在于,所述前置编码器包括特征提取器和内容编码器;所述将所述原始语音数据输入至预训练的语音转换模型的前置编码器,包括:

5.根据权利要求4所述的方法,其特征在于,所述前置编码器还包括归一化流模块,在所述将所述第一内容信息和所述第一音...

【技术特征摘要】

1.一种语音转换方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在将所述原始语音数据输入至预训练的语音转换模型的前置编码器之前,还包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述训练语音数据和所述原始语音数据完成对所述语音转换模型的训练,包括:

4.根据权利要求1所述的方法,其特征在于,所述前置编码器包括特征提取器和内容编码器;所述将所述原始语音数据输入至预训练的语音转换模型的前置编码器,包括:

5.根据权利要求4所述的方法,其特征在于,所述前置编码器还包括归一化流模块,在所述将所述第一内容信息和所述...

【专利技术属性】
技术研发人员:张旭龙王健宗程宁
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1