处理语音识别的稀疏表示特征的方法和系统技术方案

技术编号：7281098 阅读：213 留言：0更新日期：2012-04-19 21:40

本发明专利技术涉及一种处理语音识别的稀疏表示特征的方法和系统。披露了用于生成和使用稀疏表示特征来提高语音识别性能的技术。具体地说，本发明专利技术的原理提供了基于稀疏表示样例的识别技术。例如，所述方法包括以下步骤。获取与语音识别系统关联的测试向量和训练数据集。选择所述训练数据集的子集。将所述测试向量与所述训练数据集的选定子集一起映射为由稀疏约束加权的线性组合以便形成新的测试特征集，其中由于所述稀疏约束而使所述训练数据集移动到更靠近所述测试向量。针对所述新的测试特征集训练声学模型。针对所述新的测试特征集训练的声学模型可用于对输入所述语音识别系统的用户语音进行解码。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术一般地涉及语音识别，更具体地说，涉及用于生成和使用稀疏表示特征提高语音识别性能的技术。
技术介绍
众所周知，高斯混合模型(GMM) —直以来非常广泛地用于语音识别类问题。尽管 GMM允许快速的模型训练和评分，但是训练样本被汇集在一起进行参数估计，从而导致个别训练样本中存在的信息丢失。另一方面，基于样例的技术使用与实际训练实例有关的信息。尽管基于样例的方法已被证实较之GMM提升了分类任务的准确性，但是对于识别任务而言并非如此。如公知的，语音分类是将语音信号分类为先验已知的给定类别或类型集合中的给定类别或类型的任务，而语音识别是对语音信号进行解码以生成识别结果的任务。应该理解，尽管可以在语音识别任务中执行语音分类，但是在这种情况下，通常无法先验地获知类别或类型。
技术实现思路
本专利技术的原理提供了用于生成和使用稀疏表示特征提高语音识别性能的技术。具体地说，本专利技术的原理提供了基于稀疏表示样例的识别技术。例如，在一个方面中，一种方法包括以下步骤。获取与语音识别系统关联的测试向量和训练数据集。选择所述训练数据集的子集。将所述测试向量与所述训练数据集的选定子集一起映射为由稀疏约束加权的线性组合以便形成新的测试特征集，其中由于所述稀疏约束而使所述训练数据集移动到更靠近所述测试向量。针对所述新的测试特征集训练声学模型。针对所述新的测试特征集训练的声学模型可用于对输入所述语音识别系统的用户语音进行解码。有利地，通过使训练数据集受稀疏约束的影响而移动到更靠近测试向量，提高了语音识别性能，例如，帧准确性、字错误率等。当结合附图阅读本专利技术的示例性实施例的以下详细...

【技术保护点】

【技术特征摘要】
...

【专利技术属性】
技术研发人员：D·卡涅夫斯基，D·纳哈莫，B·拉马巴德兰，T·N·赛纳斯，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人