【技术实现步骤摘要】
【国外来华专利技术】语音转换方法、装置、设备及存储介质
本申请涉及信号处理领域,尤其涉及一种语音转换方法、装置、设备及储存介质。
技术介绍
随着技术的发展,语音转换技术愈发成熟,通过语音转换模型可以实现音色转换的功能,具有广阔的应用场景。技术问题但现有的语音转换模型只支持单一说话人的转换。技术解决方案基于此,有必要针对上述问题,提供一种语音转换方法、装置、设备及存储介质。第一方面,本申请实施例提供一种语音转换方法,该方法包括:获取源音频数据;接收选择的目标说话人编号和源音频数据对应的说话人编号;对源音频数据进行预处理,得到与源音频数据对应的频谱;将目标说话人编号、源音频数据对应的说话人编号和源音频数据对应的频谱作为语音转换模型的输入,获取语音转换模型输出的目标说话人的频谱;通过声码器将目标说话人的频谱转换为目标说话人的语音。在一个实施例中,语音转换模型包括:仿射矩阵、编码器和解码器,仿射矩阵用于将输入的目标说话人编号和源音频数据对应的说话人编号编码为 ...
【技术保护点】
1.一种语音转换方法,其特征在于,所述方法包括:/n获取源音频数据;/n接收选择的目标说话人编号和源音频数据对应的说话人编号;/n对所述源音频数据进行预处理,得到与所述源音频数据对应的频谱;/n将所述目标说话人编号、所述源音频数据对应的说话人编号和所述源音频数据对应的频谱作为语音转换模型的输入,获取所述语音转换模型输出的目标说话人的频谱;/n通过声码器将所述目标说话人的频谱转换为所述目标说话人的语音。/n
【技术特征摘要】
【国外来华专利技术】1.一种语音转换方法,其特征在于,所述方法包括:
获取源音频数据;
接收选择的目标说话人编号和源音频数据对应的说话人编号;
对所述源音频数据进行预处理,得到与所述源音频数据对应的频谱;
将所述目标说话人编号、所述源音频数据对应的说话人编号和所述源音频数据对应的频谱作为语音转换模型的输入,获取所述语音转换模型输出的目标说话人的频谱;
通过声码器将所述目标说话人的频谱转换为所述目标说话人的语音。
2.根据权利要求1所述的方法,其特征在于,所述语音转换模型包括:
仿射矩阵、编码器和解码器,所述仿射矩阵用于将输入的所述目标说话人编号和所述源音频数据对应的说话人编号编码为说话人向量,所述编码器用于根据所述说话人向量和所述源音频数据对应的频谱得到特征向量,所述解码器用于根据所述特征向量和所述说话人向量得到所述目标说话人的频谱。
3.根据权利要求2所述的方法,其特征在于,所述语音转换模型的训练步骤如下:
获取训练样本集,所述训练样本集中包括多个训练样本,每个训练样本包括:训练目标说话人编号、训练音频数据对应的说话人编号、训练音频数据对应的频谱和训练目标说话人的频谱;
将所述训练说话人编号、所述训练音频数据对应的说话人编号和所述训练音频数据对应的频谱作为所述语音转换模型的输入,将所述训练目标说话人的频谱作为期望的输出;
根据所述语音转换模型的实际输出和期望输出的比对结果更新所述语音转换模型的权重参数,得到训练好的所述语音转换模型。
4.根据权利要求3所述的方法,其特征在于,所述根据所述语音转换模型的实际输出和期望输出的比对结果更新所述语音转换模型的权重参数,得到训练好的所述语音转换模型,包括:
根据所述语音转换模型的所述实际输出和期望输出的比对差值计算得到损失值;
当所述损失值没有达到预设的收敛条件时,根据所述损失值更新所述语音转换模型的权重参数;
获取下一个训练样本,重新进入所述将所述训练说话人编号、所述训练音频数据对应的说话人编号和所述训练音频数据对应的频谱作为所述语音转换模型的输入,将所述训练目标说话人的频谱作为期望的输出的步骤,直至计算得到的所述损失值满足所述预设的收敛条件时,停止训练,得到训练好的所述语音转换模型。
<...
【专利技术属性】
技术研发人员:赵之源,黄东延,熊友军,
申请(专利权)人:深圳市优必选科技股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。