一种声学模型的训练方法、装置以及计算机可读存储介质制造方法及图纸

技术编号：26069264 阅读：19 留言：0更新日期：2020-10-28 16:42

本发明专利技术公开了一种声学模型的训练方法、装置以及计算机可读存储介质，包括获取带标注的声学训练数据；将所获取的声学训练数据作为云端声学模型的输入进行训练，得到第一声学后验概率；将云端声学模型中的模型参数信息更新至本地第一声学模型；基于声学训练数据和第一声学后验概率，对本地第一声学模型进行训练，得到目标第一声学模型；以所训练得到的目标第一声学模型为基础，利用模型压缩算法得到本地第二声学模型；基于声学训练数据和第一声学后验概率，对本地第二声学模型进行训练，得到目标第二声学模型。利用云端的计算资源来得到模型参数，并且通过模型参数移植和模型压缩算法来得到可应用于芯片端的本地声学模型，因而大大提高了训练效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种声学模型的训练方法、装置以及计算机可读存储介质
本专利技术涉及语音识别
，尤其涉及一种声学模型的训练方法、装置以及计算机可读存储介质。
技术介绍
语音识别是一种让机器通过识别和理解过程把语音信号转变为相应的文本或命令的人工智能技术。近年来，随着高质量的训练数据的增加，加上本地芯片计算能力不足，导致现如今依靠芯片来训练一个模型的效率变得十分低下。
技术实现思路
本专利技术实施例提供了一种声学模型的训练方法、装置以及计算机可读存储介质，具有高效地训练声学模型的效果。本专利技术一方面提供一种声学模型的训练方法，所述方法包括：获取带标注的声学训练数据；将所获取的声学训练数据作为云端声学模型的输入进行训练，得到第一声学后验概率；将所述云端声学模型中的模型参数信息更新至本地第一声学模型；基于所述声学训练数据和第一声学后验概率，对所述本地第一声学模型进行训练，得到目标第一声学模型；以所训练得到的目标第一声学模型为基础，利用模型压缩算法得到本地第二声学模型；基于所述声学训练数据和第一声学后验概率，对所述本地第二声学模型进行训练，得到目标第二声学模型。在一可实施方式中，所述带标注的声学训练数据包括相互对应的声学特征信息和文本信息。在一可实施方式中，所述云端声学模型、本地第一声学模型以及本地第二声学模型均为FSMN模型。在一可实施方式中，所述云端声学模型、本地第一声学模型以及本地第二声学模型均使用粗粒度并且不带音调的音节作为建模单元。在一可实施方式中，所述基于所述声学...

【技术保护点】
1.一种声学模型的训练方法，其特征在于，所述方法包括：/n获取带标注的声学训练数据；/n将所获取的声学训练数据作为云端声学模型的输入进行训练，得到第一声学后验概率；/n将所述云端声学模型中的模型参数信息更新至本地第一声学模型；/n基于所述声学训练数据和第一声学后验概率，对所述本地第一声学模型进行训练，得到目标第一声学模型；/n以所训练得到的目标第一声学模型为基础，利用模型压缩算法得到本地第二声学模型；/n基于所述声学训练数据和第一声学后验概率，对所述本地第二声学模型进行训练，得到目标第二声学模型。/n

【技术特征摘要】
1.一种声学模型的训练方法，其特征在于，所述方法包括：
获取带标注的声学训练数据；
将所获取的声学训练数据作为云端声学模型的输入进行训练，得到第一声学后验概率；
将所述云端声学模型中的模型参数信息更新至本地第一声学模型；
基于所述声学训练数据和第一声学后验概率，对所述本地第一声学模型进行训练，得到目标第一声学模型；
以所训练得到的目标第一声学模型为基础，利用模型压缩算法得到本地第二声学模型；
基于所述声学训练数据和第一声学后验概率，对所述本地第二声学模型进行训练，得到目标第二声学模型。

2.根据权利要求1所述的方法，其特征在于，所述带标注的声学训练数据包括相互对应的声学特征信息和文本信息。

3.根据权利要求1所述的方法，其特征在于，所述云端声学模型、本地第一声学模型以及本地第二声学模型均为FSMN模型。

4.根据权利要求1所述的方法，其特征在于，所述云端声学模型、本地第一声学模型以及本地第二声学模型均使用粗粒度并且不带音调的音节作为建模单元。

5.根据权利要求1所述的方法，其特征在于，所述基于所述声学训练数据和第一声学后验概率，对所述本地第一声学模型进行训练，得到目标第一声学模型，包括：
将所述声学训练数据作为所述本地第一声学模型的输入进行训练，得到第二声学后验概率；
基于所述第一声学后验概率和第二声学后验概率，更新所述本地第一声学模型中的参数信息，得到目标第一声学模型。

6.根据权利要求1所述的方法，其特征在于，所述基于所述声学训练数据和第一声学后验概率，对所述本地第二声学模型进行训练，得到目标第二声学模型，包括：
将所述声学训练数据作为所述本地第二声学模...

【专利技术属性】
技术研发人员：薛峰，
申请(专利权)人：苏州思必驰信息科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人