一种用于实时情感语音转换的方法及系统技术方案

技术编号：38231557 阅读：10 留言：0更新日期：2023-07-25 17:59

本申请实施例涉及音频处理技术领域，尤其涉及一种用于实时情感语音转换的方法及系统。本发明专利技术具体包括步骤一、实时采集用户录入语音数据；步骤二、将用户录入语音数据传送至模型文件中进行预处理；步骤三、待预处理完成后进行音频输出。本发明专利技术所述实时情感语音转换方法，将用户音色文件针对性匹配模型文件进行预处理，不同模型文件对应不同的待匹配音色数据，用以帮助用户自由选择音色，提高用户体验。提高用户体验。提高用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于实时情感语音转换的方法及系统

[0001]本申请实施例涉及音频处理
，尤其涉及一种用于实时情感语音转换的方法及系统。

技术介绍

[0002]传统的语音转换方法中通常采集用户输入的语音数据，并将采集的语音数据转换为二进制数据后，建立基于数据传输的网络请求，之后将服务端的用户语音数据进行转换并反馈至客户端输出。但是此种语音转换方法的语音转换质量，取决于网络传输的质量，在单一的网络传输调制参数下，无法适应多种语音转换质量的传输要求。从而由于不同用户输入的语音数据质量不同，导致语音数据传输质量不同，最终导致语音转换的自然度不足，并存在输出的语音声调单一情感体验差的问题。
[0003]公开号为CN113689867B的中国专利，提供了一种语音转换模型的预处理方法、装置、电子设备及介质，此专利通过提取原始声学中的隐特征，用以进一步提高原始声学与预测声学之间的匹配度。公开号为CN112116904B的中国专利，提供了一种语音转换方法、装置、设备及存储介质，此专利中针对原始语音可以同时进行语音与语种的转换。但是上述专利中并未明确说明匹配完成或语音转换后，针对原始声学中质量较差的信息，如何进一步进行声学质量增强。
[0004]因此，针对现有的语音转换技术中存在的问题，本专利技术中提供了一种用于实时情感语音转换的方法及系统

技术实现思路

[0005]针对上述存在的问题，本专利技术第一方面提供了用于实时情感语音转换的方法，具体包括步骤一、实时采集用户录入语音数据；步骤二、将用户录入语音数据传送...

【技术保护点】

【技术特征摘要】
1.一种用于实时情感语音转换的方法，其特征在于，具体包括步骤一、实时采集用户录入语音数据；步骤二、将用户录入语音数据传送至模型文件中进行预处理；步骤三、待预处理完成后进行音频输出。2.根据权利要求1所述用于实时情感语音转换的方法，其特征在于，所述步骤二将用户录入语音数据传送至模型文件中进行预处理中，对用户录入语音数据进行用户编号，并根据用户编号针对下发音色文件。3.根据权利要求2所述用于实时情感语音转换的方法，其特征在于，校验所述模型文件是否存在，若是，则将音色文件传送至模型文件中进行预处理；若否，则反馈模型文件导入错误。4.根据权利要求3所述用于实时情感语音转换的方法，其特征在于，所述将音色文件传送至模型文件中进行预处理中，根据音色质量进行采样域的选择。5.根据权利要求4所述用于实时情感语音转换的方法，其特征在于，根据所述采样域的选择，进行数据传输波特率的同步切换，根据波特率的同步切换进行音色...

【专利技术属性】
技术研发人员：冯超，徐颖，凌天格，
申请(专利权)人：上海格子互动信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人