模型训练方法、声学模型、语音合成系统和电子设备技术方案

技术编号：37504050 阅读：21 留言：0更新日期：2023-05-07 09:39

本申请涉及语音处理技术领域，公开了一种模型训练方法、声学模型、语音合成系统和电子设备；方法包括：获取第一模型，将输入数据输入第一模型进行处理，获取输入数据对应的第一模型输出结果；获取输入数据对应的预设标准输出结果；基于第一模型输出结果和预设标准输出结果对第一模型进行优化，获取第二模型，第二模型包括第一后处理网络；确定第一后处理网络中各通道的重要性；基于各通道的重要性对第一后处理网络中的部分通道进行裁剪，以获取第二后处理网络，并且基于第二后处理网络获得第三模型；在确定第三模型满足模型要求的情况下，将第三模型作为最终训练模型。基于上述方案，能够在保证模型性能的同时有效减小模型的占用内存。内存。内存。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、声学模型、语音合成系统和电子设备

[0001]本申请涉及语音处理
，特别涉及一种模型训练方法、声学模型、语音合成系统和电子设备。

技术介绍

[0002]目前，实现文字转换为语音功能的语音合成系统已经广泛部署于电子设备中，以满足用户对文字转换为语音功能的需求。例如，如图1所示，当用户在电子设备100的办公软件中打开文档后，并点击了语音朗读控件200，则会调用语音合成系统将文档中的文字转换为语音，以实现对文档进行朗读。
[0003]如图2所示，目前常用的将文字转换为语音的语音合成系统一般包括前端系统和后端系统，其中前端系统包括文本正则模块、韵律预测模块和注音模块；后端系统包括声学模型和声码器。其中，现有技术中声学模型一般采用自回归框架模型，如图3所示，自回归框架模型一般包括编码器、解码器和后处理模块，其中编码器包括嵌入层和序列特征提取(CBHG)模块，编码器用于对输入的文本进行特征整合，转化为高位抽象的特征向量。解码器包括注意力模型、双向长短时记忆网络(Bidirectional Long Short
‑
term Memory，BiLSTM)、线性投影网络、双层的前处理网络和停止标记(Stop Token)模块，解码器用于对编码器的输出进行解码，使得输出特征的维度靠近标准输出特征。后处理模块用于对解码器输出特征的进一步矫正。
[0004]但是自回归框架声学模型语音合成速度较慢，导致合成语音的时间较长，进而导致增加设备功耗，且自回归框架声学模还容易出现重复吐词或漏词的情...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，用于电子设备，其特征在于，所述方法包括：获取第一模型，将输入数据输入所述第一模型进行处理，获取所述输入数据对应的第一模型输出结果；获取所述输入数据对应的预设标准输出结果；基于所述第一模型输出结果和所述预设标准输出结果对所述第一模型进行优化，获取第二模型，所述第二模型包括第一后处理网络；确定所述第一后处理网络中各通道的重要性；基于所述第一后处理网络中各通道的重要性对所述第一后处理网络中的部分通道进行裁剪，以获取第二后处理网络，并且基于所述第二后处理网络获得第三模型；确定所述第三模型满足模型要求，并将所述第三模型作为最终训练模型。2.根据权利要求1所述的方法，其特征在于，所述确定所述第三模型满足模型要求，包括：将所述输入数据输入所述第三模型进行处理，获取所述输入数据对应的第三模型输出结果；当所述第三模型输出结果和所述预设标准输出结果的相似度大于等于设定值，则确定所述第三模型满足模型要求。3.根据权利要求1所述的方法，其特征在于，所述基于所述第一后处理网络中各通道的重要性对所述第一后处理网络中的部分通道进行裁剪，以获取第二后处理网络，并且基于所述第二后处理网络获得第三模型；包括：获取所述第一后处理网络中各通道的输出特征；获取所述预设标准输出结果中各通道的输出特征；基于所述第一后处理网络各通道的输出特征与所述预设标准输出结果的各通道的输出特征的相似度，确定后处理网络中各通道的重要性特征值；基于所述第一后处理网络中各通道的重要性特征值对所述第一后处理网络中的设定数量的通道进行裁剪，获取所述第二后处理网络；基于所述第二处理网络获得所述第三模型。4.根据权利要求1所述的方法，其特征在于，所述基于所述第一后处理网络中各通道的重要性对所述第一后处理网络中的部分通道进行裁剪，以获取第二后处理网络，并且基于所述第二后处理网络获得第三模型；包括：获取所述第一后处理网络中各通道的数据量；基于所述第一后处理网络中各通道的数据量对所述第一后处理网络中的设定数量的通道进行裁剪，获取所述第二后处理网络；基于所述第二处理网络获得所述第三模型。5.根据权利要求2所述的方法，其特征在于，在确定所述第三模型不满足模型要...

【专利技术属性】
技术研发人员：龚雪飞，
申请(专利权)人：荣耀终端有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人