语种识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33448642 阅读:20 留言:0更新日期:2022-05-19 00:33
本发明专利技术提供一种语种识别方法、装置、电子设备及存储介质,其中方法包括:基于骨干网络,提取待识别语音的语种特征;基于全量样本集,确定语种特征的第一识别结果;和/或,基于多个数据量分类样本集,确定语种特征的第二识别结果;基于第一识别结果和/或所述第二识别结果,确定语种识别结果。本发明专利技术提供的方法、装置、电子设备及存储介质,能够通过语音分布均衡的全量样本集训练得到的映射关系确定第一识别结果,通过多个数据量分类样本集训练得到的映射关系确定第二识别结果,提升了语种识别的分类能力,进而提高了语种的识别率,并且可以通过第一识别结合和第二识别结果联合确定语种识别结果,进一步提升了语种识别的准确率。进一步提升了语种识别的准确率。进一步提升了语种识别的准确率。

【技术实现步骤摘要】
语种识别方法、装置、电子设备及存储介质


[0001]本专利技术涉及语音交互
,尤其涉及一种语种识别方法、装置、电子设备及存储介质。

技术介绍

[0002]语种识别也称语种辨识,是指由机器自动判断一个语音片段所属某个语言种类的过程。语种识别技术经过几十年的发展,展现了巨大的应用价值和发展潜力,得到了广泛的应用。
[0003]目前主流的语种识别方法在各语种数据分布均衡时(如C个语种,每个语种占比在1/C上下),语种识别效果较好,能够达到可用级别,但现实环境中,语种分布均衡的场景很少,更多的是语种分布不均衡的场景,甚至在特殊情况下,例如:语种种类较多且部分语种占比极少的情况,则目前的语种识别方法的识别效果下降明显,无法准确识别出分布占比较少的语种。

技术实现思路

[0004]本专利技术提供一种语种识别方法、装置、电子设备及存储介质,用以解决现有技术中语种识别方法在语种数据分布失衡情况下,对分布占比小的语种识别效果差及准确率低的缺陷。
[0005]本专利技术提供一种语种识别方法,包括:
[0006]基于骨干网络,提取待识别语音的语种特征;
[0007]基于全量样本集,确定所述语种特征的第一识别结果;所述全量样本集包括全量语种的第一样本语音,且所述全量语种的第一样本语音分布均衡;
[0008]和/或,基于多个数据量分类样本集,确定所述语种特征的第二识别结果;每个数据量分类样本集包括对应数据量类别的语种的第二样本语音,所述多个数据量分类样本集基于所述全量语种的第二样本语音的数据量划分得到;
[0009]基于所述第一识别结果和/或所述第二识别结果,确定语种识别结果。
[0010]根据本专利技术提供的一种语种识别方法,所述基于全量样本集,确定所述语种特征的第一识别结果,包括:
[0011]基于第一语种识别模型,对所述语种特征进行语种分类,得到所述第一识别结果;
[0012]所述第一语种识别模型是基于所述全量样本集训练所得第一分类网络中的第一分类层,所述第一分类网络包括所述骨干网络和所述第一分类层。
[0013]根据本专利技术提供的一种语种识别方法,所述基于多个数据量分类样本集,确定所述语种特征的第二识别结果,包括:
[0014]对所述语种特征进行数据量类别分类,得到所述语种特征的数据量类别分类结果;
[0015]基于多个数据量类别分别对应的第二语种识别模型,对所述语种特征进行语种分
类,得到所述语种特征在所述多个数据量类别下的语种分类结果,所述多个数据量类别分别对应的第二语种识别模型基于所述多个数据量分类样本集训练得到;
[0016]基于所述数据量类别分类结果和所述多个数据量类别下的语种分类结果,确定所述第二识别结果。
[0017]根据本专利技术提供的一种语种识别方法,所述基于所述数据量类别分类结果和所述多个数据量类别下的语种分类结果,确定所述第二识别结果,包括:
[0018]基于所述数据量类别分类结果中任一数据量类别的后验概率和所述任一数据量类别对应的语种分类结果,确定所述任一数据量类别的部分语种识别结果;
[0019]基于各数据量类别的部分语种识别结果,得到所述第二识别结果。
[0020]根据本专利技术提供的一种语种识别方法,所述多个数据量类别分别对应的第二语种识别模型基于如下步骤训练得到:
[0021]确定第二分类网络,所述第二分类网络包括所述骨干网络和第二分类层;
[0022]基于任一数据量分类样本集,对所述第二分类网络进行训练,将训练完成的所述第二分类网络中的第二分类层作为所述任一数据量分类样本集对应数据量类别的第二语种识别模型。
[0023]根据本专利技术提供的一种语种识别方法,所述基于所述第一识别结果和/或所述第二识别结果,确定语种识别结果,包括:
[0024]基于多个特征分类样本集,确定所述语种特征的第三识别结果;每个特征分类样本集包括对应特征类别的语种的第三样本语音,所述多个特征分类样本集基于所述全量语种的样本语音的语种特征划分得到;
[0025]基于所述第一识别结果和/或所述第二识别结果,以及所述第三识别结果,确定所述语种识别结果。
[0026]根据本专利技术提供的一种语种识别方法,所述基于多个特征分类样本集,确定所述语种特征的第三识别结果,包括:
[0027]对所述语种特征进行特征类别分类,得到所述语种特征的特征类别分类结果;
[0028]基于多个特征类别分别对应的第三语种识别模型,对所述语种特征进行语种分类,得到所述语种特征在所述多个特征类别下的语种分类结果,所述多个特征类别分别对应的第三语种识别模型基于所述多个特征分类样本集训练得到;
[0029]基于所述特征类别分类结果和所述多个特征类别下的语种分类结果,确定所述第三识别结果。
[0030]根据本专利技术提供的一种语种识别方法,所述基于所述特征类别分类结果和所述多个特征类别下的语种分类结果,确定所述第三识别结果,包括
[0031]基于所述特征类别分类结果中任一特征类别的后验概率和所述任一特征类别对应的语种分类结果,确定所述任一特征类别的部分语种识别结果;
[0032]基于各特征类别的部分语种识别结果,得到所述第三识别结果。
[0033]根据本专利技术提供的一种语种识别方法,所述多个特征类别分别对应的第三语种识别模型基于如下步骤训练得到:
[0034]确定第三分类网络,所述第三分类网络包括所述骨干网络和第三分类层;
[0035]基于任一特征分类样本集,对所述第三分类网络进行训练,将训练完成的所述第
三分类网络中的第三分类层作为所述任一特征分类样本集对应特征类别的第三语种识别模型。
[0036]本专利技术还提供一种语种识别装置,包括:特征确定模块,用于基于骨干网络,提取待识别语音的语种特征;
[0037]语种识别模块,用于基于全量样本集,确定所述语种特征的第一识别结果;所述全量样本集包括全量语种的第一样本语音,且所述全量语种的第一样本语音分布均衡;
[0038]和/或,基于多个数据量分类样本集,确定所述语种特征的第二识别结果;每个数据量分类样本集包括对应数据量类别的语种的第二样本语音,所述多个数据量分类样本集基于所述全量语种的第二样本语音的数据量划分得到;
[0039]结果确定模块,用于基于所述第一识别结果和/或所述第二识别结果,确定语种识别结果。
[0040]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述语种识别方法的步骤。
[0041]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述语种识别方法的步骤。
[0042]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述语种识别方法的步骤。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语种识别方法,其特征在于,包括:基于骨干网络,提取待识别语音的语种特征;基于全量样本集,确定所述语种特征的第一识别结果;所述全量样本集包括全量语种的第一样本语音,且所述全量语种的第一样本语音分布均衡;和/或,基于多个数据量分类样本集,确定所述语种特征的第二识别结果;每个数据量分类样本集包括对应数据量类别的语种的第二样本语音,所述多个数据量分类样本集基于所述全量语种的第二样本语音的数据量划分得到;基于所述第一识别结果和/或所述第二识别结果,确定语种识别结果。2.根据权利要求1所述的语种识别方法,其特征在于,所述基于全量样本集,确定所述语种特征的第一识别结果,包括:基于第一语种识别模型,对所述语种特征进行语种分类,得到所述第一识别结果;所述第一语种识别模型是基于所述全量样本集训练所得的第一分类网络中的第一分类层,所述第一分类网络包括所述骨干网络和所述第一分类层。3.根据权利要求1所述的语种识别方法,其特征在于,所述基于多个数据量分类样本集,确定所述语种特征的第二识别结果,包括:对所述语种特征进行数据量类别分类,得到所述语种特征的数据量类别分类结果;基于多个数据量类别分别对应的第二语种识别模型,对所述语种特征进行语种分类,得到所述语种特征在所述多个数据量类别下的语种分类结果,所述多个数据量类别分别对应的第二语种识别模型基于所述多个数据量分类样本集训练得到;基于所述数据量类别分类结果和所述多个数据量类别下的语种分类结果,确定所述第二识别结果。4.根据权利要求3所述的语种识别方法,其特征在于,所述基于所述数据量类别分类结果和所述多个数据量类别下的语种分类结果,确定所述第二识别结果,包括:基于所述数据量类别分类结果中任一数据量类别的后验概率和所述任一数据量类别对应的语种分类结果,确定所述任一数据量类别的部分语种识别结果;基于各数据量类别的部分语种识别结果,得到所述第二识别结果。5.根据权利要求3或4所述的语种识别方法,其特征在于,所述多个数据量类别分别对应的第二语种识别模型基于如下步骤训练得到:确定第二分类网络,所述第二分类网络包括所述骨干网络和第二分类层;基于任一数据量分类样本集,对所述第二分类网络进行训练,将训练完成的所述第二分类网络中的第二分类层作为所述任一数据量分类样本集对应数据量类别的第二语种识别模型。6.根据权利要求1所述的语种识别方法,其特征在于,所述基于所述第一识别结果和/或所述第二识别结果,确定语种识别结果,包括:基于多个特征分类样本集,确定所述语种特征的第三识别结果;每个特征分类样本集包括对应特征类别的语种的第三样...

【专利技术属性】
技术研发人员:杨军
申请(专利权)人:合肥讯飞数码科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1