音色转换方法、装置、电子设备、存储介质和程序产品制造方法及图纸

技术编号：42228072 阅读：30 留言：0更新日期：2024-08-02 13:44

本公开涉及一种音色转换方法、装置、电子设备、存储介质和程序产品。所述方法包括：获取训练音频集，其中，所述训练音频集包括多个训练音频；对于所述训练音频集中的第一训练音频，获得所述第一训练音频对应的第一内容序列，并获得所述第一训练音频对应的第一音频编码序列；获得第二训练音频对应的第二音频编码序列，其中，所述第一训练音频和所述第二训练音频对应于同一说话人；通过音色转换模型对所述第一内容序列和所述第二音频编码序列进行处理，得到第三音频编码序列，其中，所述音色转换模型采用神经语言模型的网络结构；根据所述第一音频编码序列和所述第三音频编码序列，训练所述音色转换模型。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及音频处理，尤其涉及一种音色转换模型的训练方法、音色转换方法、音色转换模型的训练装置、音色转换装置、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

1、音色转换(voice conversion)是指将一段输入语音，转换为特定说话人的音色，并且不改变音频内容的技术方法。

2、音色转换技术具有广泛的应用场景。在游戏娱乐中，通过音色转换，录音人员可以扮演不同的角色，达到想要的声音效果，从而可以为电影、动画、视频游戏等配音。在人机交互中，通过调整声音来匹配用户喜欢的角色，可以让语音助手变得更加具有亲和力和吸引力。音色转换技术允许普通用户将自己的声音转换为不同的风格或角色，应用场景广泛。

3、因此，提高音色转换后的音频效果具有重要意义。

技术实现思路

1、本公开提供了一种音色转换技术方案。

2、根据本公开的一方面，提供了一种音色转换模型的训练方法，所述音色转换模型采用神经语言模型的网络结构，所述方法包括：

3、获取训练音频集，其中，...

【技术保护点】

1.一种音色转换模型的训练方法，其特征在于，所述音色转换模型采用神经语言模型的网络结构，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，

3.根据权利要求1或2所述的方法，其特征在于，所述获得所述第一训练音频对应的第一内容序列，包括：

4.根据权利要求1或2所述的方法，其特征在于，

5.根据权利要求2所述的方法，其特征在于，所述通过所述音色转换模型对所述第一内容序列、所述第二音频编码序列和所述第一情感标签进行处理，得到第三音频编码序列，包括：

6.根据权利要求1或2所述的方法，其特征在于，所述根据所述第一音频编码序列和...

【技术特征摘要】

1.一种音色转换模型的训练方法，其特征在于，所述音色转换模型采用神经语言模型的网络结构，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，

3.根据权利要求1或2所述的方法，其特征在于，所述获得所述第一训练音频对应的第一内容序列，包括：

4.根据权利要求1或2所述的方法，其特征在于，

6.根据权利要求1或2所述的方法，其特征在于，所述根据所述第一音频编码序列和所述第三音频编码序列，训练所述音色转换模型，包括：

7.一种音色转换方法，...

【专利技术属性】
技术研发人员：请求不公布姓名，请求不公布姓名，
申请(专利权)人：摩尔线程智能科技北京有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人