一种半监督多任务特征选择的语音识别方法技术

技术编号：15224848 阅读：342 留言：0更新日期：2017-04-27 03:14

本发明专利技术公开一种半监督多任务特征选择的语音识别方法，包括如下步骤：(1)获取T个相似的语音识别学习任务，每个学习任务t中包含一个数据集其中，dt为特征个数，ct为数据集Xt的分类数，nt是第t个学习任务中样本数；(2)为每个学习任务建立基于全局线性约束的特征选择模型；(3)在步骤(2)的基础上构建多个学习任务联合特征选择模型，得到目标函数；(4)利用迭代优化算法求解步骤(3)中的目标函数。此种语音识别方法可有效提高语音识别的准确度，同时可有效抑制数据集中噪声的干扰。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于机器学习
，特别涉及一种半监督多任务特征选择的语音识别方法。
技术介绍
在多媒体技术和互联网技术高速发展的今天，高维数据在多种领域呈现爆发式的增长，如模式识别、计算机视觉和多媒体数据分析等领域，而且处理这些高维数据需要消耗大量的时间。此外，在各类机器学习任务中，如分类、聚类等，高维数据的存在也使得特征选择变得更加复杂因难。最新研究表明，如果能预先对数据的特征进行筛选，选择其最重要的特征子集，机器学习的效率将得到有效的提高。随着高维数据的快速增长，使得标记训练集所需要消耗的人力成本急剧增加。一般地，在特征选择领域，当已标记的训练数据集样本较少时，有两种可选的解决方案：半监督特征选择算法和多任务特征选择算法。然而现有的半监督特征选择算法为了取得全局或局部可区分信息，一般需要为训练数据集建立拉普拉斯(Laplacian)矩阵。在已标记数据少的情况下，这种方法较为有效，但训练集的数量较大时，该类方法需要消耗较大的时间和空间，影响了该类方法的应用。多任务特征选择是另一种解决少量标签样本问题的方法。给定多个学习任务，多任务特征选择方法认为各个学习任务间具有相关性，并获取这些共享信息来提高不同学习任务准确性。然而，现有多任务特征选择方法是监督的，无法有效提取不同任务间未标记数据间的相关性。
技术实现思路
本专利技术的目的，在于提供一种半监督多任务特征选择的语音识别方法，其可有效提高语音识别的准确度，同时可有效抑制数据集中噪声的干扰。为了达成上述目的，本专利技术的解决方案是：一种半监督多任务特征选择的语音识别方法，包括如下步骤：(1)获取T个相似的语音识...

【技术保护点】
一种半监督多任务特征选择的语音识别方法，其特征在于包括如下步骤：(1)获取T个相似的语音识别学习任务，每个学习任务t中包含一个数据集其中，dt为特征个数，ct为数据集Xt的分类数，nt是第t个学习任务中样本数；(2)为每个学习任务建立基于全局线性约束的特征选择模型；(3)在步骤(2)的基础上构建多个学习任务联合特征选择模型，得到目标函数；(4)利用迭代优化算法求解步骤(3)中的目标函数。

【技术特征摘要】
1.一种半监督多任务特征选择的语音识别方法，其特征在于包括如下步骤：(1)获取T个相似的语音识别学习任务，每个学习任务t中包含一个数据集其中，dt为特征个数，ct为数据集Xt的分类数，nt是第t个学习任务中样本数；(2)为每个学习任务建立基于全局线性约束的特征选择模型；(3)在步骤(2)的基础上构建多个学习任务联合特征选择模型，得到目标函数；(4)利用迭代优化算法求解步骤(3)中的目标函数。2.如权利要求1所述的一种基于局部信息和组稀疏约束的半监督人脸识别方法，其特征在于：所述步骤(2)中，建立基于全局线性约束的特征选择模型如下：minWt,bt,Ftl=Yt,0≤fti≤1Σt=1T(Σi=1ntsti||Wt′xti+bt-fti||22+α...

【专利技术属性】
技术研发人员：王晓栋，曾志强，严菲，洪朝群，
申请(专利权)人：厦门理工学院，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人