变声方法、变声系统、电子设备及存储介质技术方案

技术编号：32664311 阅读：78 留言：0更新日期：2022-03-17 11:15

本发明专利技术公开了一种变声方法、变声系统、电子设备及存储介质。其中，变声方法包括：获取原说话人语音信号；根据原说话人语音信号计算得到第一梅尔频谱；确定第一梅尔频谱中的新增帧数等于预设帧数，将新增帧数标识为目标特征块；根据目标特征块的第n时间步，得到第n

全部详细技术资料下载

【技术实现步骤摘要】
变声方法、变声系统、电子设备及存储介质

[0001]本专利技术涉及变声
，尤其涉及一种变声方法、变声系统、电子设备及存储介质。

技术介绍

[0002]变声器，指能够将原说话人的语音信号转换为目标说话人语音信号的设备。
[0003]在相关技术中，变声器需要获取原说话人的完整语音信号才能进行变声转换，使得变声转换存在一定的使用延时，从而影响了变声效果。
[0004]本专利技术旨在至少解决现有技术中存在的技术问题之一。为此，本专利技术提出一种变声方法、变声系统、电子设备及存储介质，能够实现流式变声，从而在一定程度上降低变声时延。
[0005]根据本专利技术的第一方面实施例的变声方法，包括：获取原说话人语音信号；根据所述原说话人语音信号计算得到第一梅尔频谱；确定所述第一梅尔频谱中的新增帧数等于预设帧数，将所述新增帧数标识为目标特征块；根据所述目标特征块的第n时间步，得到第n
‑
1时间步的关联特征块；其中，所述关联特征块中的关联帧数等于所述预设帧数，n为大于或等于1的正整数；根据所述目标...

【技术保护点】

【技术特征摘要】
1.变声方法，其特征在于，包括：获取原说话人语音信号；根据所述原说话人语音信号计算得到第一梅尔频谱；确定所述第一梅尔频谱中的新增帧数等于预设帧数，将所述新增帧数标识为目标特征块；根据所述目标特征块的第n时间步，得到第n
‑
1时间步的关联特征块；其中，所述关联特征块中的关联帧数等于所述预设帧数，n为大于或等于1的正整数；根据所述目标特征块、所述关联特征块和预设的语义编码器得到语义特征；获取目标说话人语音信号；根据所述目标说话人语音信号得到说话人特征；对所述语义特征、所述说话人特征进行拼接操作，根据拼接操作后的所述语义特征、所述说话人特征和预设的解码器生成第二梅尔频谱；根据所述第二梅尔频谱和预设的声码器得到变声信号。2.根据权利要求1所述的变声方法，其特征在于，所述语义编码器包括第一自注意力单元；所述根据所述目标特征块、所述关联特征块和预设的语义编码器得到语义特征，包括：根据所述目标特征块、所述关联特征块和所述第一自注意力单元得到语义建模单元概率分布；根据所述语义建模单元概率分布得到所述语义特征。3.根据权利要求2所述的变声方法，其特征在于，在所述对所述语义特征、所述说话人特征进行拼接操作之前，所述变声方法还包括：对所述语义特征和所述说话人特征进行第一互信息最小化操作；根据所述原说话人语音信号得到基频信号；对所述说话人特征和所述基频信号进行第二互信息最小化操作。4.根据权利要求3所述的变声方法，其特征在于，所述变声方法还包括：根据所述第一梅尔频谱和预设的韵律编码器得到韵律特征；对所述韵律特征和所述说话人特征进行第三互信息最小化操作；所述对所述语义特征、所述说话人特征进行拼接操作，根据拼接操作后的所述语义特征、所述说话人特征和预设的解码器生成第二梅尔频谱，包括：对所述语义特征、所述说话人特征、所述韵律特征进行拼接操作，根据拼接操作后的所述语义特征、所述说话人特征、所述韵律特征和所述解码器生成所述第二梅尔频谱。5.根据权利要求1至3任一项所述的变声方法，其特征在于，...

【专利技术属性】
技术研发人员：杨浩铨，徐勇，
申请(专利权)人：哈尔滨工业大学深圳，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人