嵌入式平台大词汇量语音命令词的识别方法技术

技术编号：4269907 阅读：280 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了语音识别技术领域中的一种嵌入式平台大词汇量语音命令词的识别方法。包括下列步骤：语音信号的预处理和语音识别参数的提取、建立语音声学模型并进行语音模型训练、构建树形识别网络、应用快速识别搜索算法；其中，语音声学模型，采用基于声母右相关的词内双音子模型；构建树形识别网络具体是，构建基于相同父音节的树形识别网络，合并有相同父音节的结点；快速识别搜索算法，根据所述基于相同父音节的树形识别网络，采用动态调整窗宽的状态级剪枝策略以及帧同步词级剪枝策略。本发明专利技术对传统的嵌入式语音识别方法进行了改进，实现了内存和ＣＰＵ资源的高效利用，提高了大词汇量语音命令词识别的速度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于语音识别
，尤其涉及一种。
技术介绍
语音识别技术是指使用机器从一段语音信号中识别出语音的具体内容，广泛地应用于各种人机交互系统。随着语音技术，特别是语音识别技术的飞速发展，语音识别的应用已经越来越普遍，尤其是一些简单的命令词识别系统更是因为其识别率高，性能稳定，人机交互便捷等有利条件而获得了越来越大的应用和市场前景。比如声控服务机器人、语音识别玩具、电话转接系统、简易旅游服务导航系统等。近些年，国外一些语音技术和半导体公司都投入大量人力和物力开发语音识别专用芯片，并对自己的语音识别算法进行专利保护。这些专用芯片的语音识别算法过程通常如图1所示，输入的语音信号首先经过A/D进行采样，频谱整形加窗预加重处理，提高高频成分，进行实时特征参数提取，提取的参数为Mel频标倒谱系数(MFCC， Mel FrequencyC印strum Coefficient)，同时进行语音识别模型训练和语音识别模板匹配。传统的基于PC计算机上大词汇量语音命令词识别系统如图2所示，采用完全树状解码网络，该网络结构复杂，虽然可以减少剪枝路径数量，但是网络结构的实现上需要大量的链表和指针，造成存储量空间迅速增长；当识别任务是中小词表语音识别系统时，一般都采用并行的解码网络结构，如图3所示。这种识别网络实现容易，比较适合中小词表的嵌入式识别系统。在解码识别策略方面，一般采用一阶段的最优维特比束搜索剪枝方法。然而，由于嵌入式系统存储器资源和CPU计算资源都很有限，这种传统的方法不适应于嵌入式平台上语音命令词识别的实现，当识别任务到达万级词汇量甚至几十万...

【技术保护点】
一种嵌入式平台大词汇量语音命令词的识别方法，包括步骤：语音信号的预处理和语音识别参数的提取、建立语音声学模型并进行语音模型训练、构建树形识别网络、应用快速识别搜索算法，其特征在于，所述语音声学模型，采用基于声母右相关的词内双音子模型；所述构建树形识别网络具体是，构建基于相同父音节的树形识别网络，合并有相同父音节的结点；所述快速识别搜索算法，根据所述基于相同父音节的树形识别网络，采用动态调整窗宽的状态级剪枝策略以及帧同步词级剪枝策略。

【技术特征摘要】
一种嵌入式平台大词汇量语音命令词的识别方法，包括步骤语音信号的预处理和语音识别参数的提取、建立语音声学模型并进行语音模型训练、构建树形识别网络、应用快速识别搜索算法，其特征在于，所述语音声学模型，采用基于声母右相关的词内双音子模型；所述构建树形识别网络具体是，构建基于相同父音节的树形识别网络，合并有相同父音节的结点；所述快速识别搜索算法，根据所述基于相同父音节的树形识别网络，采用动态调整窗宽的状态级剪枝策略以及帧同步词级剪枝策略。2. 根据权利要求1所述的一种嵌入式平台大词汇量语音命令词的识别方法，其特征在于，所述动态调整窗宽的状态级剪枝策略...

【专利技术属性】
技术研发人员：刘加，钱彦旻，
申请(专利权)人：清华大学，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人