语种识别方法、模型的训练方法、相关装置及存储介质制造方法及图纸

技术编号：41820200 阅读：23 留言：0更新日期：2024-06-24 20:35

本申请公开了一种语种识别方法、模型的训练方法、相关装置及存储介质，语种识别模型的训练方法包括：获取至少一种语种的无标注语音；对各无标注语音中提取到的第一语音特征进行数据增强，得到增强后的第二语音特征；将各无标注语音的第一语音特征和第二语音特征输入至语种识别模型，得到各第一语音特征的第一语种识别结果和各第二语音特征的第二语种识别结果；基于各无标注语音对应的第一语种识别结果与第二语种识别结果之间的差异，调整语种识别模型的参数。上述方案，能够提高模型对语种识别的准确度。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及音频处理，特别是涉及一种语种识别方法、模型的训练方法、相关装置及存储介质。

技术介绍

1、语种识别也称语种辨识，是指由机器自动判断一个语音片段所属某个语言种类的过程。目前主流的语种识别方法为神经网络等。语种识别模型的识别效果严重依赖训练的数据集数量。尽管可以通过增加带标签的训练数据，但这将花费大量的标注时间及人力成本。

技术实现思路

1、本申请至少提供一种语种识别方法、模型的训练方法、相关装置及存储介质。

2、本申请第一方面提供了一种语种识别模型的训练方法，包括：获取至少一种语种的无标注语音；对各无标注语音中提取到的第一语音特征进行数据增强，得到增强后的第二语音特征；将各无标注语音的第一语音特征和第二语音特征输入至语种识别模型，得到各第一语音特征的第一语种识别结果和各第二语音特征的第二语种识别结果；基于各无标注语音对应的第一语种识别结果与第二语种识别结果之间的差异，调整语种识别模型的参数。

3、其中，基于各无标注语音对应的第一语种识别结果与第二语种识别结果...

【技术保护点】

1.一种语种识别模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于各所述无标注语音对应的第一语种识别结果与第二语种识别结果之间的差异，调整所述语种识别模型的参数，包括：

3.根据权利要求2所述的方法，其特征在于，所述第一语种识别结果中包括所述无标注语音属于各语种类别的置信度，所述确定各所述无标注语音对应的第二语种识别结果与所述标签之间的最小均方误差损失，包括：

4.根据权利要求2或3所述的方法，其特征在于，所述第一语种识别结果中包括所述无标注语音属于各语种类别的置信度，所述方法还包括：