一种语音识别方法及装置制造方法及图纸

技术编号：13591552 阅读：45 留言：0更新日期：2016-08-26 00:35

本发明专利技术涉及语音技术，公开了一种语音识别方法及装置。本发明专利技术中，预先根据通过模型训练得到的N个高斯进行软性聚类计算，得到M个软聚类高斯；在进行语音识别时，将语音转换得到特征向量，并根据该特征向量计算得分最高的前L个软聚类高斯，其中L小于M；将L个软聚类高斯内的各成员高斯，作为语音识别过程中声学模型里需要参与计算的高斯，进行声学模型似然度的计算。本发明专利技术提供的方法在语音识别的时候采用动态高斯选择的方式，减少识别过程中声学模型里需要评估的高斯个数，提高了声学模型似然度评估的速度和准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音技术，特别涉及一种语音识别方法。
技术介绍
随着语音识别技术的发展，近年来语音识别技术的准确率随着深度学习的推广取得了巨大的进步，特别是在基于云的服务中。现有的语音识别服务多数在云端实现，语音需要上传至服务器，服务器对上传的语音进行声学评估，从而给出识别结果。为了提高识别率，服务器大多采用深度学习的方法对语音进行评估。但深度学习需要耗费巨大的计算资源，在本地或者嵌入式设备中不适用。而且在很多不能联网的使用场景下，只能依赖本地语音识别技术。由于本地计算和存储资源有限，隐马尔科夫模型(HMM)和高斯混合模型(GMM)仍然是不可或缺的技术选择。这种技术框架具有以下优点:1、系统尺寸可控：高斯混合模型中的高斯数量易于在训练时控制。2、系统速度可控：使用动态高斯选择技术可以大幅度降低运算时间所谓高斯选择即在模型训练阶段，把语音识别系统中所有的高斯作为成员高斯进行聚类，形成聚类高斯；在识别的时候首先利用声学特征评估每个聚类高斯，那些似然度高的聚类高斯所对应的成员高斯被选中进行进一步的评估。而其他成员高斯被丢弃。传统的高斯选择技术有以下缺点：1、在聚类的时候采用硬聚类，即一个成员高斯只属于一个聚类高斯。聚类精确度较低。2、聚类时直接把成员高斯的均值和方差作为聚类的输入，在训练聚类
高斯的时候直接把均值和方差做简单的算术平均，聚类精度极低。3、聚类的时候，没有有效的迭代方法，致使聚类收敛于局部最优。4、识别时的高斯选择不能做到动态更新，导致过多的成员高斯保留在计算中，识别速度慢。
技术实现思路
本专利技术的目的在于提供一种语音识别方法及装置...

【技术保护点】
一种语音识别方法，其特征在于，包含以下步骤：预先根据通过模型训练得到的N个高斯，进行软性聚类计算，得到M个软聚类高斯；在进行语音识别时，将语音转换得到特征向量，并根据所述特征向量计算出得分最高的前L个软聚类高斯，所述L小于所述M；将所述L个软聚类高斯内的各成员高斯，作为语音识别过程中声学模型里需要参与计算的高斯，进行声学模型似然度的计算。

【技术特征摘要】
1.一种语音识别方法，其特征在于，包含以下步骤：预先根据通过模型训练得到的N个高斯，进行软性聚类计算，得到M个软聚类高斯；在进行语音识别时，将语音转换得到特征向量，并根据所述特征向量计算出得分最高的前L个软聚类高斯，所述L小于所述M；将所述L个软聚类高斯内的各成员高斯，作为语音识别过程中声学模型里需要参与计算的高斯，进行声学模型似然度的计算。2.根据权利要求1所述的语音识别方法，其特征在于，所述根据通过模型训练得到的N个高斯，进行软性聚类计算的步骤中，包含以下子步骤：将所述N个高斯按预设权重分配给聚类高斯；根据各高斯对所属的各聚类高斯的更新权重，重新估计聚类高斯，得到所述M个软聚类高斯。3.根据权利要求2所述的语音识别方法，其特征在于，所述根据通过模型训练得到的N个高斯，进行软性聚类计算的步骤中，采用以下任意算法，进行所述软性聚类的计算：K均值算法、C均值算法、自组织图算法。4.根据权利要求3所述的语音识别方法，其特征在于，在采用K均值算法重新估计聚类高斯时，计算各聚类高斯的最小聚类代价；对所述最小聚类代价求导，获取每个成员高斯对每个聚类高斯的更新权重；根据获取到的每个成员高斯对每个聚类高斯的更新权重，计算各聚类高
\t斯的均值和方差，得到所述重新估计的聚类高斯；将所述重新估计的聚类高斯，作为所述M个软聚类高斯。5.根据权利要求4所述的语音识别方法，其特征在于，根据以下公式计算所述最小聚类代价Q：Q=Σn=1N(Σi=1mg(i,n)WSKLD(i,n)+γΣm=1Mg(i,n)log1g(i,n))]]>其中，g(i,n)表示第n个高斯对第i个聚类高斯的更新权重；γ为预设的聚类软硬度参数；WSKLD表示作为高斯之间距离判据的加权对称KL散度。6.根据权利要求1所述的语音识别方法...

【专利技术属性】
技术研发人员：王育军，侯锐，
申请(专利权)人：乐视致新电子科技天津有限公司，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人