一种基于改进型动态时间规整语音识别算法的实现方法技术

技术编号：18528083 阅读：206 留言：0更新日期：2018-07-25 13:42

本发明专利技术公开了一种基于改进型动态时间规整语音识别算法的实现方法，包括：根据参考模板和测试模板选取匹配路径时满足边界条件、连续性和单调性约束的特点，将两者匹配路径的选取范围限制在相似度矩阵上靠近对角线周围的平行四边形区域内，因此无需计算平行四边形之外的路径点所对应的时间帧的匹配距离，并且不需要保存全部的帧匹配距离和累加距离矩阵。针对传统动态时间规整算法在匹配过程中匹配路径过多导致运算量过大的问题，本发明专利技术通过在路径匹配过程中进一步加入边界范围的约束，成功筛除一些与模板匹配最终结果无关的路径，大大减少了匹配过程中的不必要的运算以及内存使用，有效提高了动态时间规整语音识别算法的运算速度以及识别效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于改进型动态时间规整语音识别算法的实现方法
本专利技术涉及一种基于改进型动态时间规整语音识别算法的实现方法，属于语音识别控制
，可用于对计算量和内存使用比较敏感的嵌入式语音识别

技术介绍
随着人类社会的进步和科学技术的迅速发展，人们开始追求智能、便捷的家居环境，语音识别控制技术在智能家居中的运用变得尤其重要，它可以使得人们摆脱手动控制设备的烦恼，只通过语音就可以达到控制家电设备的目的，所以语音识别控制成为一个热门的研究方向。语音识别技术在PC(计算机)这种可用资源较多、运算能力强的设备上发展已较为成熟，其识别效果也已经很好，但是在硬件资源有限、运算能力相对较弱的嵌入式平台上仍然面临一些问题，选择合适的语音识别算法并进行优化改进以节省硬件使用、减少计算量已经成为必须考虑的问题。其中，DTW(动态时间规整)算法是比较经典和成熟的语音识别算法，它利用动态规划(DP)的方法有效解决了语音信号特征参数的帧长度不等(在语音识别领域表现为人的语速变化导致的发音时间长短不一)的问题，即采用对输入语音信号进行伸长或缩短直到与标准模式的长度一致，从而计算两个语音序列之间的相似性(匹配度)。在基于中小词汇量的孤立词语音识别系统中，其识别率与隐马尔可夫模型(HMM)算法相差无几，而算法复杂度却低得多，所以DTW算法比较适合于较少词汇量的孤立词为主的语音命令控制。DTW是一个典型的优化问题，它用满足一定条件的时间规整函数W(n)来描述测试模板和参考模板的时间对应关系，求解两模板匹配时累计距离最小所对应的规整函数。测试语音参数共有I帧矢量，而参考模板共有J帧矢量...

【技术保护点】
1.一种基于改进型动态时间规整语音识别算法的实现方法，其特征在于，根据参考模板和测试模板选取匹配路径时满足边界条件、连续性和单调性约束的特点，将两者匹配路径的选取范围限制在相似度矩阵上靠近对角线周围的平行四边形区域内，即在匹配过程中进一步加入边界范围的约束。

【技术特征摘要】
1.一种基于改进型动态时间规整语音识别算法的实现方法，其特征在于，根据参考模板和测试模板选取匹配路径时满足边界条件、连续性和单调性约束的特点，将两者匹配路径的选取范围限制在相似度矩阵上靠近对角线周围的平行四边形区域内，即在匹配过程中进一步加入边界范围的约束。2.根据权利要求1所述的一种基于改进型动态时间规整语音识别算法的实现方法，其特征在于，具体包括以下步骤：S1：通过测试模板的语音序列Q＝[q1，q2，…，qi，…，qn]，其中，n＝N为测试模板的语音序列的总帧数，qi为该语音序列中每一帧的特征值，以及参考模板的语音序列C＝[c1，c2，…，cj，…，cm]，其中，m＝M为参考模板的语音序列的总帧数，cj为该语音序列中每一帧的特征值，得到一个n×m的相似度矩阵网络，该矩阵(i,j)处的元素为qi和cj两个点的距离d(qi,cj)，即d(qi,cj)＝(qi-cj)2，同时建立坐标系，以参考模板的时间帧j为x轴，以测试模板的时间帧i为y轴，来寻找一条通过此矩阵网络中若干格点的规整代价最小的匹配路径；S2：判断测试模板和参考模板之间是否满足公式(1)的限制条件：如果不能满足，则得到ymax＝N和ymin＝1，其中，ymax为匹配路径选取范围的上边界，ymin为匹配路径选取范围的下边界，直接转至步骤S5；如果满足公式(1)的限制条件则继续下一步；S3：计算得到xa＝int[(2N-M)/3]，xb＝int[(4M-2N)/3]...

【专利技术属性】
技术研发人员：刘昊，吕修任，姚国良，
申请(专利权)人：东南大学—无锡集成电路技术研究所，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人