语音转换方法、系统、电子设备及存储介质技术方案

技术编号：38103428 阅读：20 留言：0更新日期：2023-07-06 09:23

本申请实施例提供了一种语音转换方法、系统、电子设备及存储介质，属于人工智能技术领域。语音转换系统在执行语音转换方法时，先对样本语音数据进行编码，得到样本特征数据，再对样本特征数据进行分类处理和解码处理，得到样本分类结果和样本语音转换结果，在对抗训练的过程中，根据样本分类结果、样本语音转换结果和样本语音数据的域标签调整语音转换模型的参数，完成对语音转换模型中各模块的训练，随后在应用过程中，可以将目标语音数据输入至调整参数后的语音转换模型中，得到目标语音转换结果，目标语音转换结果是一种清晰的目标说话人语音，因此本申请实施例能够实现对带噪语音的转换，提高语音转换的效果，提高语音转换的质量。的质量。的质量。

全部详细技术资料下载

【技术实现步骤摘要】
语音转换方法、系统、电子设备及存储介质

[0001]本申请涉及人工智能领域，尤其涉及一种语音转换方法、系统、电子设备及存储介质。

技术介绍

[0002]语音转换是输入一条源说话人的语音，在保持说话内容不变的情况下，对语音进行处理，转化为目标说话人的语音。相关技术中，通常采用质量要求较高的语音作为语音转换系统的输入数据，而当输入的语音数据含有噪声时，语音转换系统无法转换得到清晰的目标说话人语音，语音转换的效果差、质量低。

技术实现思路

[0003]本申请实施例的主要目的在于提出一种语音转换方法、系统、电子设备及存储介质，能够提高语音转换的效果，提高语音转换的质量。
[0004]为实现上述目的，本申请实施例的第一方面提出了一种语音转换方法，所述方法包括：获取来自源域和目标域的样本语音数据，并将所述样本语音数据输入至语音转换模型中，其中，来自所述源域的所述样本语音数据为干净样本，来自所述目标域的所述样本语音数据为噪声样本；对所述样本语音数据进行编码，得到样本特征数据；对所述样本特征数据进行分类处理，得到样本...

【技术保护点】

【技术特征摘要】
1.一种语音转换方法，其特征在于，所述方法包括：获取来自源域和目标域的样本语音数据，并将所述样本语音数据输入至语音转换模型中，其中，来自所述源域的所述样本语音数据为干净样本，来自所述目标域的所述样本语音数据为噪声样本；对所述样本语音数据进行编码，得到样本特征数据；对所述样本特征数据进行分类处理，得到样本分类结果；对所述样本特征数据进行解码，得到样本语音转换结果；根据所述样本分类结果、所述样本语音转换结果和所述样本语音数据的域标签调整所述语音转换模型的参数；获取目标语音数据，将目标语音数据输入至调整参数后的所述语音转换模型中，得到目标语音转换结果。2.根据权利要求1所述的语音转换方法，其特征在于，所述语音转换模型包括目标对象编码器和语音内容编码器，所述对所述样本语音数据进行编码，得到样本特征数据，包括：将所述样本语音数据输入至所述目标对象编码器中进行编码，得到目标对象特征；将所述样本语音数据输入至所述语音内容编码器中进行编码，得到内容特征；根据所述目标对象特征和所述内容特征得到样本特征数据。3.根据权利要求1或2所述的语音转换方法，其特征在于，所述语音转换模型包括梯度反转层和域分类器，所述对所述样本特征数据进行分类处理，得到样本分类结果，包括：将所述样本特征数据输入至所述梯度反转层中进行梯度反转处理，得到样本变换数据；将所述样本变换数据输入至所述域分类器中进行域分类处理，得到样本分类结果。4.根据权利要求3所述的语音转换方法，其特征在于，所述将所述样本特征数据输入至所述梯度反转层中进行梯度反转处理，得到样本变换数据，包括：将所述样本特征数据输入至所述梯度反转层；通过所述梯度反转层在前向传播中对所述样本特征数据进行恒等变换，得到恒等变换后的样本变换数据；其中，所述梯度反转层还用于在反向传播中更改所述样本特征数据对应的梯度符号。5.根据权利要求1所述的语音转换方法，其特征在于，所述根据所述样本分类结果、所述样本语音转换结果和所述样本语音数据的域标签调整所述语音转换模型的参数，包括：获取来自源域的所述样本语音数据对应的清晰语音频谱，获取所述样本特征数据的先验概率和后验概率；根据所述样本语音转换结果和所述清晰语音频谱之间的平均绝对误差，得到重建损失值；根据所述先验概率和所述后验概率之间的相对熵，得到相对熵损失值；根据所述样本分类结果和所述样本语音数据的域标签，得到域分类损失值；根据所述重建损失值、所述相对熵损失值和所述域分类...

【专利技术属性】
技术研发人员：张旭龙，王健宗，唐浩彬，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人