语音处理方法、系统、设备及存储介质技术方案

技术编号：35217513 阅读：17 留言：0更新日期：2022-10-15 10:33

本发明专利技术涉及人工智能，提供了一种语音处理方法、系统、设备及存储介质,该方法包括：获取语音信号和说话人向量，其中，语音信号包括时域分辨率；根据语音信号得到梅尔谱数据；将梅尔谱数据导入预设的声码器网络结构中的第一卷积层进行提取处理，得到初始隐状态数据，声码器网络结构包括第一卷积层、上采样层、残差层和第二卷积层，其中，第一卷积层的通道数量与第二卷积层的通道数量不同；在初始隐状态数据经过上采样层的上采样处理，得到降维隐状态数据的情况下，将说话人向量和降维隐状态数据导入残差层进行合成处理，得到混合数据，其中，降维隐状态数据的序列长度与时域分辨率一致；将混合数据导入第二卷积层进行降维处理，得到语音波形。语音波形。语音波形。

全部详细技术资料下载

【技术实现步骤摘要】
语音处理方法、系统、设备及存储介质

[0001]本专利技术涉及人工智能
，尤其涉及一种语音处理方法、系统、设备及存储介质。

技术介绍

[0002]目前，在语音合成(Text to Speech，简称TTS)技术，涉及声学、语言学、数字信号处理技术、多媒体技术等多个学科技术，是中文信息处理领域的一项前沿技术。语音合成就是一个将文本转化为语音输出的过程，该过程分成三个部分，文字前端、声学模型和声码器，文字前端将文字转化为音素、语气、语调控制信息，声学模型再将这些信息转化为频谱图，声码器的作用是将频谱图转化为声波，声码器为TTS流程中的后端。
[0003]声码器承担着很重要的角色，声码器的好坏往往决定着整个语音处理系统的质量。在拥有多说话人大量训练数据的前提下，相关技术的声码器实现方法已能合成训练数据集内各说话人的高自然度语音。然而，针对训练数据集以外说话人且数据量匮乏的情况，相关技术的声码器实现方法的合成自然度欠佳。通常依靠尽可能多地录制说话人数据以改善合成自然度，需要耗费大量的人力和精力，因此，如何提高说话人语音合成的自然度，成为了亟待解决的技术问题。

技术实现思路

[0004]以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
[0005]本专利技术实施例提供了一种语音处理方法、系统、设备及存储介质，能够在数据量匮乏的情况下，提高说话人语音合成的自然度。
[0006]第一方面，本专利技术实施例提供了一种语音处理方法，该方法包括：
[0007...

【技术保护点】

【技术特征摘要】
1.一种语音处理方法，所述方法包括：获取语音信号和说话人向量，其中，所述语音信号包括时域分辨率；根据所述语音信号得到梅尔谱数据；将所述梅尔谱数据导入预设的声码器网络结构中的第一卷积层进行提取处理，得到初始隐状态数据，所述声码器网络结构包括所述第一卷积层、上采样层、残差层和第二卷积层，其中，所述第一卷积层的通道数量与所述第二卷积层的通道数量不同；在所述初始隐状态数据经过所述上采样层的上采样处理，得到降维隐状态数据的情况下，将所述说话人向量和所述降维隐状态数据导入所述残差层进行合成处理，得到混合数据，其中，所述降维隐状态数据的序列长度与所述时域分辨率一致；将所述混合数据导入所述第二卷积层进行降维处理，得到语音波形。2.根据权利要求1所述的语音处理方法，其特征在于，所述将所述说话人向量和所述降维隐状态数据导入所述残差层进行合成处理，得到混合数据，包括：根据预设的激活函数，对所述说话人向量和所述降维隐状态数据进行计算，得到综合映射数据；根据所述综合映射数据和所述降维隐状态数据，得到混合数据。3.根据权利要求2所述的语音处理方法，其特征在于，所述根据预设的激活函数，对所述说话人向量和所述降维隐状态数据进行计算，得到综合映射数据，包括：将所述降维隐状态数据与说话人卷积量进行叠加处理，得到初始混合数据；将所述初始混合数据导入预设的第一激活函数进行计算，得到第一映射数据；将所述初始混合数据导入预设的第二激活函数进行计算，得到第二映射数据；将所述第一映射数据和所述第二映射数据进行矩阵点乘计算，得到综合映射数据；其中，所述说话人卷积量表征为所述说话人向量经过一维卷积计算得到的数值。4.根据权利要求2所述的语音处理方法，其特征在于，根据所述综合映射数据和所述降维隐状态数据，得到混合数据，包括：将所述综合映射数据经过一维卷积计算得到的数值与降维隐状态卷积量进行叠加处理，得到混合数据；其中，所述降维隐状态卷积量表征为所述降维隐状态数据经过一维卷积计算得到的数值。5.根据权利要求1所述的语音处理方法，其特征在于，所述上采样层和所述残差层设置有多个，所述上采样层的数量与所述残差层的数量一一对应且所述上采样层与所述残差层依次连接；所述在所述初始...

【专利技术属性】
技术研发人员：郭洋，王健宗，程宁，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人