【技术实现步骤摘要】
本专利技术属于机器学习
,特别涉及一种半监督多任务特征选择的语音识别方法。
技术介绍
在多媒体技术和互联网技术高速发展的今天,高维数据在多种领域呈现爆发式的增长,如模式识别、计算机视觉和多媒体数据分析等领域,而且处理这些高维数据需要消耗大量的时间。此外,在各类机器学习任务中,如分类、聚类等,高维数据的存在也使得特征选择变得更加复杂因难。最新研究表明,如果能预先对数据的特征进行筛选,选择其最重要的特征子集,机器学习的效率将得到有效的提高。随着高维数据的快速增长,使得标记训练集所需要消耗的人力成本急剧增加。一般地,在特征选择领域,当已标记的训练数据集样本较少时,有两种可选的解决方案:半监督特征选择算法和多任务特征选择算法。然而现有的半监督特征选择算法为了取得全局或局部可区分信息,一般需要为训练数据集建立拉普拉斯(Laplacian)矩阵。在已标记数据少的情况下,这种方法较为有效,但训练集的数量较大时,该类方法需要消耗较大的时间和空间,影响了该类方法的应用。多任务特征选择是另一种解决少量标签样本问题的方法。给定多个学习任务,多任务特征选择方法认为各个学习任务间具有相关性,并获取这些共享信息来提高不同学习任务准确性。然而,现有多任务特征选择方法是监督的,无法有效提取不同任务间未标记数据间的相关性。
技术实现思路
本专利技术的目的,在于提供一种半监督多任务特征选择的语音识别方法,其可有效提高语音识别的准确度,同时可有效抑制数据集中噪声的干扰。为了达成上述目的,本专利技术的解决方案是:一种半监督多任务特征选择的语音识别方法,包括如下步骤:(1)获取T个相似的语音识 ...
【技术保护点】
一种半监督多任务特征选择的语音识别方法,其特征在于包括如下步骤:(1)获取T个相似的语音识别学习任务,每个学习任务t中包含一个数据集其中,dt为特征个数,ct为数据集Xt的分类数,nt是第t个学习任务中样本数;(2)为每个学习任务建立基于全局线性约束的特征选择模型;(3)在步骤(2)的基础上构建多个学习任务联合特征选择模型,得到目标函数;(4)利用迭代优化算法求解步骤(3)中的目标函数。
【技术特征摘要】
1.一种半监督多任务特征选择的语音识别方法,其特征在于包括如下步骤:(1)获取T个相似的语音识别学习任务,每个学习任务t中包含一个数据集其中,dt为特征个数,ct为数据集Xt的分类数,nt是第t个学习任务中样本数;(2)为每个学习任务建立基于全局线性约束的特征选择模型;(3)在步骤(2)的基础上构建多个学习任务联合特征选择模型,得到目标函数;(4)利用迭代优化算法求解步骤(3)中的目标函数。2.如权利要求1所述的一种基于局部信息和组稀疏约束的半监督人脸识别方法,其特征在于:所述步骤(2)中,建立基于全局线性约束的特征选择模型如下:minWt,bt,Ftl=Yt,0≤fti≤1Σt=1T(Σi=1ntsti||Wt′xti+bt-fti||22+α...
【专利技术属性】
技术研发人员:王晓栋,曾志强,严菲,洪朝群,
申请(专利权)人:厦门理工学院,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。