使用离散语言模型的语音识别方法和设备技术

技术编号：3047072 阅读：194 留言：0更新日期：2012-04-11 18:40

本发明专利技术的主题是一种语言识别方法，包括收集音频信号的步骤，声学－语言学解码步骤和语言学解码步骤。根据本发明专利技术、语言学解码包括下列步骤：把一组语言模型离散应用于声音顺序的分析，用来确定一组候选词的顺序；用搜索引擎从该候选的顺序确定最可能的词的顺序。本发明专利技术的主题也是一种为实现该方法设备。（*该技术在2020年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种语音识别方法，它包括几种语言模型的实现以获得更好的识别。本专利技术也涉及用于实现这一方法的设备。大量词汇的语音识别依赖于隐藏的马尔可夫(Marckov)模型，无论是声学部分或语言部分。因此，一个句子的识别相当于寻找最可能的由话筒记录的声音数据给出的词序。通常Viterbi算法用于这一任务。但是，对于实际问题，例如有几千个词的词汇，甚至对bigram型简单的语言模型，用来分析的Merkov网络包含了太多的状态，使它不可能应用Viterbi算法来完成任务。简化是必须的。一种已知的简化就是所谓的“最大有效范围搜索”(“beam-search”)方法，它依据这样一种简单的思想在Viterbi运算过程中，网式结构的某一状态，如果它获得的分值低于某个门限值(网式结构是这些状态的瞬时代表，是Markov网络的过渡)就被消除。这种切断明显地减少了为最可能的顺序而进行的搜索过程中用于比较的状态的数目。一种方便的替换形式就是所谓的“N-最佳搜索”方法(对N个最佳解的搜索)，它输出表现为最高分的n个顺序。当句子左右分析的分值处于中间值时，用在N-最佳搜索方法中的...

【技术保护点】
一种语音识别方法，包括收集音学信号的步骤，声学－语音学的解码步骤和语言学解码步骤，其特征在于语言学解码步骤包括如下步骤： .把一组语言模型离散应用于声音顺序的分析，用来确定一组候选词的顺序； .用搜索引擎从候选的句子中确定最可能的词的顺序。

【技术特征摘要】
FR 1999-12-2 99/151891.一种语音识别方法，包括收集音学信号的步骤，声学—语音学的解码步骤和语言学解码步骤，其特征在于语言学解码步骤包括如下步骤·把一组语言模型离散应用于声音顺序的分析，用来确定一组候选词的顺序；·用搜索引擎从候选的句子中确定最可能的词的顺序。2.根据权利要求1所述的方法，其特征在于，搜索引擎的确定依...

【专利技术属性】
技术研发人员：努尔埃迪塔齐尼，弗雷德里克苏夫莱，
申请(专利权)人：汤姆森许可贸易公司，
类型：发明
国别省市：FR[法国]

全部详细技术资料下载我是这个专利的主人