声学模型预训练方法、模型训练方法及装置、存储介质制造方法及图纸

技术编号：41537483 阅读：21 留言：0更新日期：2024-06-03 23:16

本公开提供一种声学模型预训练方法、模型训练方法及装置、存储介质。声学模型预训练方法包括：获取关键词的音素序列；利用声学模型获取音素序列中的第i个音素的声学帧在当前轮次的帧向量，1≤i≤N，N为音素总数；利用帧向量，对第i个音素在前一轮次的结构向量进行更新，以得到第i个音素在当前轮次的结构向量；根据每个音素在当前轮次的结构向量和每个音素的声学帧在当前轮次的帧向量，确定第一目标损失函数；根据目标损失函数对声学模型进行训练。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及信息处理领域，特别涉及一种声学模型预训练方法、模型训练方法及装置、存储介质。

技术介绍

1、开放词汇kws(keyword spotting,关键词检测)系统允许用户自定义唤醒词，但其应用时会受到模型大小的限制，因此需要将模型进行压缩(剪枝)后才能部署到设备。

技术实现思路

1、专利技术人注意到，在相关技术中，剪枝技术通常与关键词无关，因此剪枝后的模型不能将与关键词相关的模型参数挑选出来，从而针对不同关键词的识别准确率词差异较大，整体的识别准确率不高。

2、据此，本公开提供一种模型训练方法，通过利用音素的结构向量对声学模型进行剪枝，从而在保证整体识别准确率的同时，还能得到轻量级的声学模型。

3、根据本公开实施例的第一方面，提供一种声学模型预训练方法，包括：获取关键词的音素序列；利用声学模型获取所述音素序列中的第i个音素的声学帧在当前轮次的帧向量，1≤i≤n，n为音素总数；利用所述帧向量，对所述第i个音素在前一轮次的结构向量进行更新，以得到所述第i个音素在当...

【技术保护点】

1.一种声学模型预训练方法，包括：

2.根据权利要求1所述的方法，其中，确定第一目标损失函数包括：

3.根据权利要求2所述的方法，其中，确定第一损失函数包括：

4.根据权利要求3所述的方法，其中，确定所述第i个音素的距离损失函数包括：

5.根据权利要求3所述的方法，其中，

6.根据权利要求2所述的方法，其中，确定第二损失函数包括：

7.根据权利要求6所述的方法，其中，确定所述第i个音素的稀疏损失函数包括：

8.根据权利要求6所述的方法，其中，

9.根据权利要求2所述的方法，其中，根据所述第一损...

【技术特征摘要】

1.一种声学模型预训练方法，包括：

2.根据权利要求1所述的方法，其中，确定第一目标损失函数包括：

3.根据权利要求2所述的方法，其中，确定第一损失函数包括：

4.根据权利要求3所述的方法，其中，确定所述第i个音素的距离损失函数包括：

5.根据权利要求3所述的方法，其中，

6.根据权利要求2所述的方法，其中，确定第二损失函数包括：

7.根据权利要求6所述的方法，其中，确定所述第i个音素的稀疏损失函数包括：

8.根据权利要求6所述的方法，其中，

9.根据权利要求2所述的方法，其中，根据所述第一损失函数和所述第二损失函数确定所述第一目标损失函数包括：

10.根据权利要求1所述的方法，其中，

11.根据权利要求1-10中任一项所述的方法，其中，利用所述声学模型获取所述第i个音素的声学帧在当前轮次的帧向量包括：

12.根据权利要求11所述的方法，其中，利用所述声学模型获取所述第i个音素的声学帧在当前轮次的帧向量包括：

13.根据权...

【专利技术属性】
技术研发人员：于善勇，范璐，
申请(专利权)人：京东城市北京数字科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人