语种识别方法、装置、电子设备和介质制造方法及图纸

技术编号:35133484 阅读:17 留言:0更新日期:2022-10-05 10:07
本公开涉及一种语种识别方法、装置、电子设备和介质,尤其涉及语音识别技术领域;其中,该方法包括:获取第一音频数据分别属于不同的候选语种的第一得分,以及第二音频数据分别属于不同的候选语种的第二得分,第一音频数据为目标控制设备的唤醒词对应的音频数据,第二音频数据为目标控制设备的控制命令对应的音频数据;根据第一音频数据和第二音频数据的语种关联权重函数、第一得分以及第二得分,确定第二音频数据分别属于不同的候选语种的目标得分;基于目标得分确定第二音频数据对应的目标语种。本公开实施例能够对目标控制设备的控制命令对应的音频数据进行语种识别,且语种识别的准确率较高。的准确率较高。的准确率较高。

【技术实现步骤摘要】
语种识别方法、装置、电子设备和介质


[0001]本公开涉及语音识别
,尤其涉及一种语种识别方法、装置、电子设备和介质。

技术介绍

[0002]语种识别是通过计算机识别出语音数据所属语言种类的过程。在工作和日常生活中,多语种混说的现象越来越常见,而这给语种识别带了困难。尤其是在远场语音交互过程中,用户通过特定的唤醒词将设备成功唤醒后,再根据相应的控制命令与设备进行识别交互。
[0003]现有技术中,语种识别主要分为三个过程,首先根据语音信号进行特征提取,然后建立语种识别模型,最后是对测试语音进行语种判决。传统的语种识别系统包括基于隐式马尔可夫模型(Hidden Markov Model,HMM)等机器学习的语种识别、基于音素识别器的语种识别以及基于底层声学特征的语种识别等。但是,现有技术中的语种识别局限于声学的研究和建模的不足,导致语种识别的准确率有待提高。

技术实现思路

[0004]为了解决上述技术或者至少部分地解决上述技术问题,本公开提供了一种语种识别方法、装置、电子设备和介质,可以对目标控制设备的控制命令对应的音频数据进行语种识别,且语种识别的准确率较高。
[0005]为了实现上述目的,本公开实施例提供的技术方案如下:
[0006]第一方面,本公开提供了一种语种识别方法,该方法包括:
[0007]获取第一音频数据分别属于不同的候选语种的第一得分,以及第二音频数据分别属于不同的候选语种的第二得分,所述第一音频数据为目标控制设备的唤醒词对应的音频数据,所述第二音频数据为所述目标控制设备的控制命令对应的音频数据;
[0008]根据所述第一音频数据和所述第二音频数据的语种关联权重函数、所述第一得分以及所述第二得分,确定所述第二音频数据分别属于不同的候选语种的目标得分;
[0009]基于所述目标得分确定所述第二音频数据对应的目标语种。
[0010]作为本公开实施例一种可选的实施方式,所述根据所述第一音频数据和所述第二音频数据的语种关联权重函数、所述第一得分以及所述第二得分,确定所述第二音频数据分别属于不同的候选语种的目标得分,包括:
[0011]根据所述第一音频数据对应的结束时间、所述第二音频数据对应的起始时间以及所述语种关联权重函数,确定所述第一音频数据和所述第二音频数据的语种关联权重系数;
[0012]基于所述语种关联权重系数、所述第一得分以及所述第二得分,确定所述第二音频数据分别属于不同的候选语种的目标得分。
[0013]作为本公开实施例一种可选的实施方式,所述根据所述第一音频数据对应的结束
时间、所述第二音频数据对应的起始时间以及所述语种关联权重函数,确定所述第一音频数据和所述第二音频数据的语种关联权重系数之前,还包括:
[0014]基于端点检测方法,确定所述第一音频数据对应的结束时间和所述第二音频数据对应的起始时间。
[0015]作为本公开实施例一种可选的实施方式,所述基于所述语种关联权重系数、所述第一得分以及所述第二得分,确定所述第二音频数据分别属于不同的候选语种的目标得分,包括:
[0016]将所述第一得分与所述语种关联权重系数相乘,得到对应的乘积;
[0017]将所述乘积与所述第二得分相加,得到所述第二音频数据分别属于不同的候选语种的目标得分。
[0018]作为本公开实施例一种可选的实施方式,所述获取第一音频数据分别属于不同的候选语种的第一得分,包括:
[0019]对所述第一音频数据进行预处理,得到处理后的音频信号;
[0020]对所述音频信号进行特征提取,得到对应的第一梅尔频率倒谱系数特征;
[0021]将所述第一梅尔频率倒谱系数特征输入至混合语言语种识别模型中,得到所述第一音频数据分别属于不同的候选语种的第一得分。
[0022]作为本公开实施例一种可选的实施方式,所述混合语言语种识别模型通过以下方式训练得到:
[0023]获取训练集样本,所述训练集样本中包含多个不同语种的音频样本;
[0024]对所述音频样本进行特征提取,得到对应的第二梅尔频率倒谱系数特征;
[0025]将所述第二梅尔频率倒谱系数特征输入至混合语言语种识别模型中进行训练,直到所述混合语言语种识别模型收敛。
[0026]作为本公开实施例一种可选的实施方式,所述根据所述第一音频数据和所述第二音频数据的语种关联权重函数、所述第一得分以及所述第二得分,确定所述第二音频数据分别属于不同的候选语种的目标得分之前,还包括:
[0027]确定权重预测阶数和权重预测系数;
[0028]基于所述权重预测阶数和所述权重预测系数,确定所述第一音频数据和所述第二音频数据的语种关联权重函数。
[0029]第二方面,本公开提供了一种语种识别装置,该装置包括:
[0030]预测得分确定模块,用于获取第一音频数据分别属于不同的候选语种的第一得分,以及第二音频数据分别属于不同的候选语种的第二得分,所述第一音频数据为目标控制设备的唤醒词对应的音频数据,所述第二音频数据为所述目标控制设备的控制命令对应的音频数据;
[0031]目标得分确定模块,用于根据所述第一音频数据和所述第二音频数据的语种关联权重函数、所述第一得分以及所述第二得分,确定所述第二音频数据分别属于不同的候选语种的目标得分;
[0032]目标语种确定模块,用于基于所述目标得分确定所述第二音频数据对应的目标语种。
[0033]作为本公开实施例一种可选的实施方式,所述目标得分确定模块,包括:
[0034]系数确定单元,用于根据所述第一音频数据对应的结束时间、所述第二音频数据对应的起始时间以及所述语种关联权重函数,确定所述第一音频数据和所述第二音频数据的语种关联权重系数;
[0035]得分确定单元,用于基于所述语种关联权重系数、所述第一得分以及所述第二得分,确定所述第二音频数据分别属于不同的候选语种的目标得分。
[0036]作为本公开实施例一种可选的实施方式,所述装置还包括:时间确定模块,用于:
[0037]在根据所述第一音频数据对应的结束时间、所述第二音频数据对应的起始时间以及所述语种关联权重函数,确定所述第一音频数据和所述第二音频数据的语种关联权重系数之前,基于端点检测方法,确定所述第一音频数据对应的结束时间和所述第二音频数据对应的起始时间。
[0038]作为本公开实施例一种可选的实施方式,所述得分确定单元,具体用于:
[0039]将所述第一得分与所述语种关联权重系数相乘,得到对应的乘积;
[0040]将所述乘积与所述第二得分相加,得到所述第二音频数据分别属于不同的候选语种的目标得分。
[0041]作为本公开实施例一种可选的实施方式,所述预测得分确定模块,包括:
[0042]第一得分确定单元,用于:
[0043]对所述第一音频数据进行预处理,得到处理后的音频信号;
[0044]对所述音频信号进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语种识别方法,其特征在于,所述方法包括:获取第一音频数据分别属于不同的候选语种的第一得分,以及第二音频数据分别属于不同的候选语种的第二得分,所述第一音频数据为目标控制设备的唤醒词对应的音频数据,所述第二音频数据为所述目标控制设备的控制命令对应的音频数据;根据所述第一音频数据和所述第二音频数据的语种关联权重函数、所述第一得分以及所述第二得分,确定所述第二音频数据分别属于不同的候选语种的目标得分;基于所述目标得分确定所述第二音频数据对应的目标语种。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一音频数据和所述第二音频数据的语种关联权重函数、所述第一得分以及所述第二得分,确定所述第二音频数据分别属于不同的候选语种的目标得分,包括:根据所述第一音频数据对应的结束时间、所述第二音频数据对应的起始时间以及所述语种关联权重函数,确定所述第一音频数据和所述第二音频数据的语种关联权重系数;基于所述语种关联权重系数、所述第一得分以及所述第二得分,确定所述第二音频数据分别属于不同的候选语种的目标得分。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一音频数据对应的结束时间、所述第二音频数据对应的起始时间以及所述语种关联权重函数,确定所述第一音频数据和所述第二音频数据的语种关联权重系数之前,还包括:基于端点检测方法,确定所述第一音频数据对应的结束时间和所述第二音频数据对应的起始时间。4.根据权利要求2所述的方法,其特征在于,所述基于所述语种关联权重系数、所述第一得分以及所述第二得分,确定所述第二音频数据分别属于不同的候选语种的目标得分,包括:将所述第一得分与所述语种关联权重系数相乘,得到对应的乘积;将所述乘积与所述第二得分相加,得到所述第二音频数据分别属于不同的候选语种的目标得分。5.根据权利要求1所述的方法,其特征在于,所述获取第一音频数据分别属于不同的候选语种的第一得分,包括:对所述第一音频数据进行预处理,得到处理后的音频信号;对所述音频信号进行特征提取,得到对应的第一梅尔频率倒谱系数特征...

【专利技术属性】
技术研发人员:丁晓鹏
申请(专利权)人:海信视像科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1