分类语种识别方法及装置制造方法及图纸

技术编号:36893244 阅读:9 留言:0更新日期:2023-03-15 22:08
本申请实施例提供一种分类语种识别方法及装置,方法包括:对待识别语音数据进行概率线性语种判别分类,得到判决打分并选择打分高于阈值的语种类别作为候选集;通过设定支持向量机二分类器对所述候选集中的待识别语音数据的语种差异性特征矢量进行语种判别分类,确定最终语种识别结果;本申请能够有效降低添加联合判决带来的时间复杂度和错误率。联合判决带来的时间复杂度和错误率。联合判决带来的时间复杂度和错误率。

【技术实现步骤摘要】
分类语种识别方法及装置


[0001]本申请涉及数据处理领域,具体涉及一种分类语种识别方法及装置。

技术介绍

[0002]对于数据量较少的训练语音数据集,可能提取得到的各个语种的特征矢量间区分性不足,导致在语种识别系统的分类判决时,存在一定的误判决率。

技术实现思路

[0003]针对现有技术中的问题,本申请提供一种分类语种识别方法及装置,能够有效降低添加联合判决带来的时间复杂度和错误率。
[0004]为了解决上述问题中的至少一个,本申请提供以下技术方案:
[0005]第一方面,本申请提供一种分类语种识别方法,包括:
[0006]对待识别语音数据进行概率线性语种判别分类,得到判决打分并选择打分高于阈值的语种类别作为候选集;
[0007]通过设定支持向量机二分类器对所述候选集中的待识别语音数据的语种差异性特征矢量进行语种判别分类,确定最终语种识别结果。
[0008]进一步地,所述对待识别语音数据进行概率线性语种判别分类,得到判决打分并选择打分高于阈值的语种类别作为候选集,包括:
[0009]对待识别语音数据进行概率线性语种判别分类;
[0010]根据相应的判决打分,取打分最高和第二高的语种作为候选集。
[0011]进一步地,所述通过设定支持向量机二分类器对所述候选集中的待识别语音数据的语种差异性特征矢量进行语种判别分类,确定最终语种识别结果,包括:
[0012]将所述候选集中的待识别语音数据的语种差异性特征矢量输入设定支持向量机二分类器进行语种判别分类;
[0013]若所述判别分类的结果为目标语种,则保持原判别结果,否则根据所述候选集更新所述判别结果。
[0014]进一步地,所述若所述判别分类的结果为目标语种,则保持原判别结果,否则根据所述候选集更新所述判别结果,包括:
[0015]若所述判别分类的结果为目标语种,则保持原判别结果中判决打分最高的语种为最终语种;
[0016]若所述判别分类的结果为非目标语种,则将判决打分第二高的语种更新为最终语种。
[0017]第二方面,本申请提供一种分类语种识别装置,包括:
[0018]PLDA判别模块,用于对待识别语音数据进行概率线性语种判别分类,得到判决打分并选择打分高于阈值的语种类别作为候选集;
[0019]SVM判别模块,用于通过设定支持向量机二分类器对所述候选集中的待识别语音
数据的语种差异性特征矢量进行语种判别分类,确定最终语种识别结果。
[0020]进一步地,所述PLDA判别模块包括:
[0021]判别打分单元,用于对待识别语音数据进行概率线性语种判别分类;
[0022]候选集组建单元,用于根据相应的判决打分,取打分最高和第二高的语种作为候选集。
[0023]进一步地,所述SVM判别模块包括:
[0024]二分类判别单元,用于将所述候选集中的待识别语音数据的语种差异性特征矢量输入设定支持向量机二分类器进行语种判别分类;
[0025]识别结果确定单元,用于若所述判别分类的结果为目标语种,则保持原判别结果,否则根据所述候选集更新所述判别结果。
[0026]进一步地,所述识别结果确定单元包括:
[0027]结果维持子单元,用于若所述判别分类的结果为目标语种,则保持原判别结果中判决打分最高的语种为最终语种;
[0028]结果更新子单元,用于若所述判别分类的结果为非目标语种,则将判决打分第二高的语种更新为最终语种。
[0029]第三方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的分类语种识别方法的步骤。
[0030]第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的分类语种识别方法的步骤。
[0031]第五方面,本申请提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现所述的分类语种识别方法的步骤。
[0032]由上述技术方案可知,本申请提供一种分类语种识别方法及装置,通过对待识别语音数据进行概率线性语种判别分类,得到判决打分并选择打分高于阈值的语种类别作为候选集;通过设定支持向量机二分类器对所述候选集中的待识别语音数据的语种差异性特征矢量进行语种判别分类,确定最终语种识别结果,由此能够有效降低添加联合判决带来的时间复杂度和错误率。
附图说明
[0033]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0034]图1为本申请实施例中的分类语种识别方法的流程示意图之一;
[0035]图2为本申请实施例中的分类语种识别方法的流程示意图之二;
[0036]图3为本申请实施例中的分类语种识别方法的流程示意图之三;
[0037]图4为本申请实施例中的分类语种识别方法的流程示意图之四;
[0038]图5为本申请实施例中的分类语种识别装置的结构图之一;
[0039]图6为本申请实施例中的分类语种识别装置的结构图之二;
[0040]图7为本申请实施例中的分类语种识别装置的结构图之三;
[0041]图8为本申请实施例中的分类语种识别装置的结构图之四;
[0042]图9为本申请实施例中的电子设备的结构示意图。
具体实施方式
[0043]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0044]本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
[0045]考虑到现有技术中存在的问题,本申请提供一种分类语种识别方法及装置,通过对待识别语音数据进行概率线性语种判别分类,得到判决打分并选择打分高于阈值的语种类别作为候选集;通过设定支持向量机二分类器对所述候选集中的待识别语音数据的语种差异性特征矢量进行语种判别分类,确定最终语种识别结果,由此能够有效降低添加联合判决带来的时间复杂度和错误率。
[0046]为了能够有效降低添加联合判决带来的时间复杂度和错误率,本申请提供一种分类语种识别方法的实施例,参见图1,所述分类语种识别方法具体包含有如下内容:
[0047]步骤S101:对待识别语音数据进行概率线性语种判别分类,得到判决打分并选择打分高于阈值的语种类别作为候选集。
[0048]可选的,本申请可以在第一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分类语种识别方法,其特征在于,所述方法包括:对待识别语音数据进行概率线性语种判别分类,得到判决打分并选择打分高于阈值的语种类别作为候选集;通过设定支持向量机二分类器对所述候选集中的待识别语音数据的语种差异性特征矢量进行语种判别分类,确定最终语种识别结果。2.根据权利要求1所述的分类语种识别方法,其特征在于,所述对待识别语音数据进行概率线性语种判别分类,得到判决打分并选择打分高于阈值的语种类别作为候选集,包括:对待识别语音数据进行概率线性语种判别分类;根据相应的判决打分,取打分最高和第二高的语种作为候选集。3.根据权利要求1所述的分类语种识别方法,其特征在于,所述通过设定支持向量机二分类器对所述候选集中的待识别语音数据的语种差异性特征矢量进行语种判别分类,确定最终语种识别结果,包括:将所述候选集中的待识别语音数据的语种差异性特征矢量输入设定支持向量机二分类器进行语种判别分类;若所述判别分类的结果为目标语种,则保持原判别结果,否则根据所述候选集更新所述判别结果。4.根据权利要求3所述的分类语种识别方法,其特征在于,所述若所述判别分类的结果为目标语种,则保持原判别结果,否则根据所述候选集更新所述判别结果,包括:若所述判别分类的结果为目标语种,则保持原判别结果中判决打分最高的语种为最终语种;若所述判别分类的结果为非目标语种,则将判决打分第二高的语种更新为最终语种。5.一种分类语种识别装置,其特征在于,包括:PLDA判别模块,用于对待识别语音数据进行概率线性语种判别分类,得到判决打分并选择打分高于阈值的语种类别作为候选集;SVM判别模块,用于通过设定支持向量机...

【专利技术属性】
技术研发人员:蔡晨
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1