一种半监督多任务特征选择的语音识别方法技术

技术编号:15224848 阅读:342 留言:0更新日期:2017-04-27 03:14
本发明专利技术公开一种半监督多任务特征选择的语音识别方法,包括如下步骤:(1)获取T个相似的语音识别学习任务,每个学习任务t中包含一个数据集其中,dt为特征个数,ct为数据集Xt的分类数,nt是第t个学习任务中样本数;(2)为每个学习任务建立基于全局线性约束的特征选择模型;(3)在步骤(2)的基础上构建多个学习任务联合特征选择模型,得到目标函数;(4)利用迭代优化算法求解步骤(3)中的目标函数。此种语音识别方法可有效提高语音识别的准确度,同时可有效抑制数据集中噪声的干扰。

【技术实现步骤摘要】

本专利技术属于机器学习
,特别涉及一种半监督多任务特征选择的语音识别方法。
技术介绍
在多媒体技术和互联网技术高速发展的今天,高维数据在多种领域呈现爆发式的增长,如模式识别、计算机视觉和多媒体数据分析等领域,而且处理这些高维数据需要消耗大量的时间。此外,在各类机器学习任务中,如分类、聚类等,高维数据的存在也使得特征选择变得更加复杂因难。最新研究表明,如果能预先对数据的特征进行筛选,选择其最重要的特征子集,机器学习的效率将得到有效的提高。随着高维数据的快速增长,使得标记训练集所需要消耗的人力成本急剧增加。一般地,在特征选择领域,当已标记的训练数据集样本较少时,有两种可选的解决方案:半监督特征选择算法和多任务特征选择算法。然而现有的半监督特征选择算法为了取得全局或局部可区分信息,一般需要为训练数据集建立拉普拉斯(Laplacian)矩阵。在已标记数据少的情况下,这种方法较为有效,但训练集的数量较大时,该类方法需要消耗较大的时间和空间,影响了该类方法的应用。多任务特征选择是另一种解决少量标签样本问题的方法。给定多个学习任务,多任务特征选择方法认为各个学习任务间具有相关性,并获取这些共享信息来提高不同学习任务准确性。然而,现有多任务特征选择方法是监督的,无法有效提取不同任务间未标记数据间的相关性。
技术实现思路
本专利技术的目的,在于提供一种半监督多任务特征选择的语音识别方法,其可有效提高语音识别的准确度,同时可有效抑制数据集中噪声的干扰。为了达成上述目的,本专利技术的解决方案是:一种半监督多任务特征选择的语音识别方法,包括如下步骤:(1)获取T个相似的语音识别学习任务,每个学习任务t中包含一个数据集其中,dt为特征个数,ct为数据集Xt的分类数,nt是第t个学习任务中样本数;(2)为每个学习任务建立基于全局线性约束的特征选择模型;(3)在步骤(2)的基础上构建多个学习任务联合特征选择模型,得到目标函数;(4)利用迭代优化算法求解步骤(3)中的目标函数。上述步骤(2)中,建立基于全局线性约束的特征选择模型如下:其中,为第t个学习任务特征选择矩阵,Wt'表示Wt的转置矩阵;为第t个任务的标签矩阵,其中mt表示已标记样本数;为的第j个元素,如果属于第j个类,则否则为元素全为1的向量,为基准参数;为任务t的训练权重;为任务t的预测标签矩阵,初始时,且α为惩罚因子,为的2范数,||Wt||2,1为Wt的l2,1范数。上述步骤(3)中,目标函数如下:其中,W={W1,…,WT本文档来自技高网...

【技术保护点】
一种半监督多任务特征选择的语音识别方法,其特征在于包括如下步骤:(1)获取T个相似的语音识别学习任务,每个学习任务t中包含一个数据集其中,dt为特征个数,ct为数据集Xt的分类数,nt是第t个学习任务中样本数;(2)为每个学习任务建立基于全局线性约束的特征选择模型;(3)在步骤(2)的基础上构建多个学习任务联合特征选择模型,得到目标函数;(4)利用迭代优化算法求解步骤(3)中的目标函数。

【技术特征摘要】
1.一种半监督多任务特征选择的语音识别方法,其特征在于包括如下步骤:(1)获取T个相似的语音识别学习任务,每个学习任务t中包含一个数据集其中,dt为特征个数,ct为数据集Xt的分类数,nt是第t个学习任务中样本数;(2)为每个学习任务建立基于全局线性约束的特征选择模型;(3)在步骤(2)的基础上构建多个学习任务联合特征选择模型,得到目标函数;(4)利用迭代优化算法求解步骤(3)中的目标函数。2.如权利要求1所述的一种基于局部信息和组稀疏约束的半监督人脸识别方法,其特征在于:所述步骤(2)中,建立基于全局线性约束的特征选择模型如下:minWt,bt,Ftl=Yt,0≤fti≤1Σt=1T(Σi=1ntsti||Wt′xti+bt-fti||22+α...

【专利技术属性】
技术研发人员:王晓栋曾志强严菲洪朝群
申请(专利权)人:厦门理工学院
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1