一种语音克隆方法、语音克隆系统、存储介质及程序产品技术方案

技术编号：44508230 阅读：12 留言：0更新日期：2025-03-07 13:05

一种语音克隆方法、语音克隆系统、存储介质及程序产品，涉及人工智能领域，该方法包括：采集目标说话者的原始语音；对原始语音进行预处理操作，得到优化语音数据；从优化语音数据中提取语音特征数据；通过预设深度学习模型对语音特征数据进行训练，得到训练后的语音克隆模型；基于语音克隆模型，根据输入的文本内容，生成克隆语音；计算克隆语音与原始语音的相似度；在相似度超过预设相似度阈值时，输出克隆语音。实施该方法，以提高语音克隆的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能领域，尤其涉及一种语音克隆方法、语音克隆系统、存储介质及程序产品。

技术介绍

1、随着人工智能的快速发展，语音合成技术在多个领域得到了广泛应用，如智能客服、有声读物、语音导航等。其中，语音克隆作为语音合成的一个重要分支，能够模仿特定说话者的语音特征，在个性化语音服务方面具有重要价值。

2、目前，语音克隆技术主要是通过声学规则库来进行语音生成，声学规则库中包含了声调、语调、语速等语音单元，在语音生成阶段，语音克隆系统根据文本，从声学规则库中选择相应的语音单元进行组合，并按照预设语音规则进行调整，最终生成语音。

3、由于声学规则库匹配方法主要依赖于预设语音规则，生成的语音往往带有明显的机械感，当需要表达不同的情感或语气时，难以实现自然的语音表现。

技术实现思路

1、本申请提供了一种语音克隆方法、语音克隆系统、存储介质及程序产品，用于提高语音克隆的准确性。

2、第一方面，本申请提供了一种语音克隆方法，应用于语音克隆系统，该方法包括：采集目标说...

【技术保护点】

1.一种语音克隆方法，其特征在于，应用于语音克隆系统，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述原始语音进行预处理操作，得到优化语音数据，所述预处理操作包括降噪处理、音频质量标准化处理和语句切分处理，具体包括：

3.根据权利要求1所述的方法，其特征在于，所述从所述优化语音数据中提取语音特征数据，所述语音特征数据包括音高特征、音色特征、时长特征和强度特征，具体包括：

4.根据权利要求1所述的方法，其特征在于，所述通过预设深度学习模型对所述语音特征数据进行训练，得到训练后的语音克隆模型，所述语音克隆模型用于克隆所述目标说话者的语音...

【技术特征摘要】

1.一种语音克隆方法，其特征在于，应用于语音克隆系统，所述方法包括：

4.根据权利要求1所述的方法，其特征在于，所述通过预设深度学习模型对所述语音特征数据进行训练，得到训练后的语音克隆模型，所述语音克隆模型用于克隆所述目标说话者的语音，所述预设深度学习模型中包括编码器和解码器，具体包括：

5.根据权利要求4所述的方法，其特征在于，所述将所述隐层特征与所述语音特征数据对应的文本特征数据进行融合，得到综合特征，具体包括：

6.根据权利要求1所述的方法，其特...

【专利技术属性】
技术研发人员：李双彬，
申请(专利权)人：北京特医互联生物科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人