音频生成方法、装置、设备和存储介质制造方法及图纸

技术编号：42687404 阅读：23 留言：0更新日期：2024-09-10 12:35

本发明专利技术公开了一种音频生成方法、装置、设备和存储介质，涉及音频技术领域。该方法包括：响应接收到的文本信息，获取目标用户的历史音频信息，文本信息由目标用户通过目标终端发送；从历史音频信息中提取音色特征；对提取的音色特征进行聚类，以确定聚类中心的音色特征；根据聚类中心的音色特征确定目标用户的当前音色特征；将目标用户的当前音色特征和文本信息输入语音生成模型，以生成具有目标用户的当前音色特征的目标音频。通过本发明专利技术实施例的技术方案可以生成个性化语音，从而提高用户体验。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术实施例涉及音频，尤其涉及一种音频生成方法、装置、设备和存储介质。

技术介绍

1、在日常生活和工作中，人们经常需要接收和发送文字信息。然而，在某些特定场景下，例如：驾驶、运动或视觉障碍等，用户可能无法直接查看或读取文字消息。这时，用户如果能够收听到与文字信息内容相对应的音频信息，将极大地提高信息接收的便利性和安全性。

2、现有的文字转语音技术虽然可以将文字转换为语音，但通常只能使用预设或通用的语音库来将文字转换为语音，缺乏个性化和真实感，从而影响用户的体验。

3、因此，亟需提出一种新的方法来解决上述问题。

技术实现思路

1、本专利技术提供一种音频生成方法、装置、设备和存储介质，可以生成个性化语音，从而提高用户体验。

2、第一方面，本专利技术实施例提供了一种音频生成方法，包括：

3、响应接收到的文本信息，获取目标用户的历史音频信息，所述文本信息由所述目标用户通过目标终端发送；

4、从所述历史音频信息中提取音色特征；

<...

【技术保护点】

1.一种音频生成方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的音频生成方法，其特征在于，响应接收到的文本信息，获取目标用户的历史音频信息，包括：

3.根据权利要求1所述的音频生成方法，其特征在于，从所述历史音频信息中提取音色特征，包括：

4.根据权利要求1所述的音频生成方法，其特征在于，对提取的音色特征进行聚类，以确定聚类中心的音色特征，包括：

5.根据权利要求1所述的音频生成方法，其特征在于，根据所述聚类中心的音色特征确定所述目标用户的当前音色特征之前，还包括：

6.根据权利要求5所述的音频生成方法，其特征...

【技术特征摘要】

1.一种音频生成方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的音频生成方法，其特征在于，响应接收到的文本信息，获取目标用户的历史音频信息，包括：

3.根据权利要求1所述的音频生成方法，其特征在于，从所述历史音频信息中提取音色特征，包括：

4.根据权利要求1所述的音频生成方法，其特征在于，对提取的音色特征进行聚类，以确定聚类中心的音色特征，包括：

5.根据权利要求1所述的音频生成方法，其特征在于，根据所述聚类中心的音色特征确定所述目标用户的当前音色特征之前，还包括：

6.根据权利要求5所述的音频生成方法...

【专利技术属性】
技术研发人员：张毅，陈博，付振，王明月，何金鑫，孙宇嘉，梁小明，王紫烟，
申请(专利权)人：中国第一汽车股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人