音色转换方法、装置、设备及存储介质制造方法及图纸

技术编号：38639199 阅读：16 留言：0更新日期：2023-08-31 18:33

本申请公开了一种音色转换方法、装置、设备及存储介质，涉及音频处理技术领域。该方法包括：对第一音频进行音源分离，得到语音音频和非语音音频；基于语音音频的音色变化，将语音音频切分为至少两个语音音频片段；根据各个语音音频片段分别对应的音色，对语音音频片段进行音色转换，得到转换后的语音音频；根据转换后的语音音频和非语音音频，生成第二音频，该第二音频是对第一音频进行音色转换后得到的音频。上述方法实现了对输入音频中具有不同音色的音频片段进行区分，并相应转换为不同的目标音色，提升了音色转换的灵活性，有助于提升最终转换得到的输出音频的听感丰富度。升最终转换得到的输出音频的听感丰富度。升最终转换得到的输出音频的听感丰富度。

全部详细技术资料下载

【技术实现步骤摘要】
音色转换方法、装置、设备及存储介质

[0001]本申请涉及音频处理
，特别涉及一种音色转换方法、装置、设备及存储介质。

技术介绍

[0002]语音转换技术是一种将某一个发音人所说的音频内容，转换到另一个发音人的音色上的语音算法技术。本申请主要涉及说话语音的音色转换。
[0003]语音转换的技术类型可以分为两类：一是只保留发音人A的音频内容信息，转换后的音频由发音人B的发音节奏(每个字的发音时间)和发音特点(音调高低、音量高低、声音起伏等)来表达该内容信息；二是完全保留发音人A在音频中的内容信息、发音节奏和发音特点等，转换后只是用发音人B的音色声纹来表达该音频，通俗的说即将发音人B的音色“套”在该音频上。本申请主要针对上述第二种语音转换技术。
[0004]然而，目前的语音转换系统，对于目标音色的指定只有一个，当源音频中有多个音色时，整段音频只能转换到一个目标音色，导致音频整体的听感丰富度下降。

技术实现思路

[0005]本申请实施例提供了一种音色转换方法、装置、设备及存储介质。本申请实施例提供的技术方案如下：
[0006]根据本申请实施例的一个方面，提供了一种音色转换方法，所述方法包括：
[0007]对第一音频进行音源分离，得到语音音频和非语音音频；
[0008]基于所述语音音频的音色变化，将所述语音音频切分为至少两个语音音频片段；
[0009]根据各个所述语音音频片段分别对应的音色，对所述语音音频片段进行音色转换，得到转换后的语音音频；
[...

【技术保护点】

【技术特征摘要】
1.一种音色转换方法，其特征在于，所述方法包括：对第一音频进行音源分离，得到语音音频和非语音音频；基于所述语音音频的音色变化，将所述语音音频切分为至少两个语音音频片段；根据各个所述语音音频片段分别对应的音色，对所述语音音频片段进行音色转换，得到转换后的语音音频；根据所述转换后的语音音频和所述非语音音频，生成第二音频，所述第二音频是对所述第一音频进行音色转换后得到的音频。2.根据权利要求1所述的方法，其特征在于，所述基于所述语音音频的音色变化，将所述语音音频切分为至少两个语音音频片段，包括：将所述语音音频划分为多个第一音频片段；获取各个所述第一音频片段分别对应的声纹特征；根据各个所述第一音频片段分别对应的声纹特征的变化情况，将所述语音音频切分为所述至少两个语音音频片段。3.根据权利要求2所述的方法，其特征在于，所述根据各个所述第一音频片段分别对应的声纹特征的变化情况，将所述语音音频切分为所述至少两个语音音频片段，包括：计算相邻两个所述第一音频片段分别对应的声纹特征之间的相似度；若所述相似度小于阈值，则在相邻两个所述第一音频片段之间添加切分标记；根据所述语音音频中添加的各个所述切分标记，将所述语音音频切分为所述至少两个语音音频片段。4.根据权利要求1所述的方法，其特征在于，所述根据各个所述语音音频片段分别对应的音色，对所述语音音频片段进行音色转换，得到转换后的语音音频，包括：根据各个所述语音音频片段分别对应的音色，确定各个所述语音音频片段分别对应的目标音色；将所述语音音频片段对应的音色，转换为对应的目标音色，得到转换后的语音音频片段；根据各个所述转换后的语音音频片段，得到所述转换后的语音音频。5.根据权利要求4所述...

【专利技术属性】
技术研发人员：黄杰雄，罗程方，高阳升，
申请(专利权)人：广州世音联软件科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人