语音转换方法、系统、电子设备及可读存储介质技术方案

技术编号：30554753 阅读：13 留言：0更新日期：2021-10-30 13:36

本公开公开了语音转换方法、系统、电子设备及可读存储介质，涉及语音、深度学习等人工智能技术领域，尤其涉及语音转换领域。具体实现方案为：语音转换方法，包括：获取目标说话人第一语音；获取原说话人语音；提取目标说话人第一语音的第一特征参数；提取原说话人语音的第二特征参数；将所述第一特征参数和所述第二特征参数进行处理得到梅尔谱信息；将所述梅尔谱信息进行转换，输出同目标说话人第一语音的音色相同，并且同原说话人语音的内容相同的目标说话人第二语音。本公开的语音转换方法及系统保留了目标说话人的语音情感、腔调等音色特征，并且见减小了运算成本。并且见减小了运算成本。并且见减小了运算成本。

全部详细技术资料下载

【技术实现步骤摘要】
语音转换方法、系统、电子设备及可读存储介质

[0001]本公开涉及语音、深度学习等人工智能
，尤其涉及语音转换技术。

技术介绍

[0002]语音转换，指的是在保留原有的语义信息不变的前提下，通过改变原说话人的语音个性特征使之具备目标说话人的语音个性特征，使一个人的语音经过转换后听起来像另一个人的语音。语音转换的研究具有很重要的应用价值和理论价值。每一个声学特征参数都无法代表人的全部的个性特征信息，所以我们通过选取最能代表不同人的语音个性特征参数进行语音的转换。

技术实现思路

[0003]本公开提供了一种用于提升语音转换效果，保留原语音音色的语音转换方法、系统、电子设备以及可读存储介质。
[0004]根据本公开的一方面，提供了一种在音色方面更接近目标说话人的语音转换方法，包括：
[0005]获取目标说话人第一语音；
[0006]获取原说话人语音；
[0007]提取目标说话人第一语音的第一特征参数；
[0008]提取原说话人语音的第二特征参数；
[0009]将所述第一特征参数和所述第二特征参数进行处理得到梅尔谱信息；
[0010]将所述梅尔谱信息进行转换，输出同目标说话人第一语音的音色相同，并且同原说话人语音的内容相同的目标说话人第二语音。
[0011]根据本公开的另一方面，提供了一种语音转换系统，包括：
[0012]第一获取模块：用于获取目标说话人第一语音；
[0013]第二获取模块：用于获取原说话人语音；
[...

【技术保护点】

【技术特征摘要】
1.一种语音转换方法，包括：获取目标说话人第一语音；获取原说话人语音；提取目标说话人第一语音的第一特征参数；提取原说话人语音的第二特征参数；将所述第一特征参数和所述第二特征参数进行处理得到梅尔谱信息；将所述梅尔谱信息进行转换，输出同目标说话人第一语音的音色相同，并且同原说话人语音的内容相同的目标说话人第二语音。2.根据权利要求1所述的方法，其中，所述获取的目标说话人第一语音和获取的原说话人语音都为音频信息。3.根据权利要求1所述的方法，其中，所述第一特征参数包括：具有时间维度信息的声纹特征。4.根据权利要求3所述的方法，其中，所述提取目标说话人第一语音的第一特征参数，包括：提取目标说话人第一语音的声纹特征；对所述目标说话人第一语音的声纹特征加上时间维度获得第一特征参数。5.根据权利要求1所述的方法，其中，所述第二特征参数包括：和时间相关的文本编码、第一基频、以及第一基频表征。6.根据权利要求5所述的方法，其中，所述提取原说话人语音的第二特征参数，包括：提取原说话人语音的类文本特征；对所述类文本特征降维处理，获得和时间相关的文本编码；将所述类文本特征经过处理得到第一基频和第一基频表征。7.根据权利要求6所述的方法，其中，所述将所述类文本特征经过处理得到第一基频和第一基频表征，包括：利用所述原说话人语音和所述类文本特征通过神经网络训练，获取所述类文本特征到基频的映射模型；利用所述类文本特征到基频的映射模型对所述类文本特征进行处理获得第一基频和第一基频表征。8.根据权利要求7所述的方法，其中，所述通过神经网络训练包括：利用卷积层和长短期记忆网络进行训练。9.根据权利要求1所述的方法，其中，所述将所述第一特征参数和所述第二特征参数进行处理得到梅尔谱信息，包括：将所述第一特征参数和所述第二特征参数进行整合编码获得语音的每一帧的编码特征；将所述每一帧的编码特征经过解码器，获得梅尔谱信息。10.一种语音转换系统，包括：第一获取模...

【专利技术属性】
技术研发人员：陈怿翔，王俊超，康永国，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人