【技术实现步骤摘要】
本申请涉及语种识别,更具体地,涉及一种语种识别模型的训练方法、装置、电子设备以及存储介质。
技术介绍
1、语种识别技术用于模仿人的思维对语音进行语种辨识,通过从语音信号中提取出各语种的差异信息,并以此为依据判断所属语种,语种识别是自然语言处理领域中一个重要的研究分支。
2、通常利用预设的损失函数以及包括大量训练样本的训练样本集对模型进行训练,以得到用于识别多个语种的语种识别模型。而若想要在语种分类时获得更高的精度,则要求同一个语种区域的多个特征之间的差距较小,而不同语种的特征之间差距较大,同一个语种的不同特征之间的差异形成类内距离,不同类别之间的特征之间的差异形成类间距离。在相关技术中,通常对语种识别模型训练时,预设损失函数中的类间距离是固定的,但由于不同语种的样本数据不平衡、部分语种的训练样本数量匮乏、语种类别错综繁杂,往往会使得训练得到的语种识别模型对于易混淆的语种难以达到理想的识别精度。
技术实现思路
1、有鉴于此,本申请提出了一种语种识别模型的训练方法、装置、电子设备以
本文档来自技高网...【技术保护点】
1.一种语种识别模型的训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述类间距离为初始类间距离与类间距离缩放系数的乘积,所述若目标语种对应的分类混淆率大于或等于目标阈值,则在减小所述目标损失函数中的所述目标语种对应的类间距离之后,返回所述根据训练样本集以及目标损失函数,对用于识别多个语种的初始识别模型进行训练的步骤,直至所述每个语种对应的分类混淆率小于所述目标阈值,包括:
3.根据权利要求2所述的方法,其特征在于,所述语种识别模型用于进行由大到小的多个分类粒度下的语种分类,所述多个语种包括多个第一语种,所述多个
...【技术特征摘要】
1.一种语种识别模型的训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述类间距离为初始类间距离与类间距离缩放系数的乘积,所述若目标语种对应的分类混淆率大于或等于目标阈值,则在减小所述目标损失函数中的所述目标语种对应的类间距离之后,返回所述根据训练样本集以及目标损失函数,对用于识别多个语种的初始识别模型进行训练的步骤,直至所述每个语种对应的分类混淆率小于所述目标阈值,包括:
3.根据权利要求2所述的方法,其特征在于,所述语种识别模型用于进行由大到小的多个分类粒度下的语种分类,所述多个语种包括多个第一语种,所述多个第一语种为第一目标分类粒度下的多个语种;
4.根据权利要求3所述的方法,其特征在于,在所述根据所述训练样本集以及与所述多个第一语种相关联的目标损失函数,对用于识别所述多个第一语种的初始识别模型进行训练之前,所述方法还包...
【专利技术属性】
技术研发人员:郑颖龙,吴广财,唐乐,陈非,马春,
申请(专利权)人:南方电网数字电网集团有限公司广东分公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。