语音识别方法及语境模型分级结构生成方法技术

技术编号：3046634 阅读：332 留言：0更新日期：2012-04-11 18:40

在这里所披露的本发明专利技术涉及一种采用语境模型的分级结构来将语音转换成文本的方法。可以将该语境模型分级结构统计平滑成语言模型。该方法可以包括用多个语境模型来处理文本。多个语境模型中的每一个可以与所述多个语境模型的分级结构中的节点对应。本发明专利技术的方法还可包括识别出与该文本相关的至少一个语境模型并且用所识别出的至少一个语境模型来处理随后的用户话语。（*该技术在2022年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别以及基于对话的系统的领域，更具体地说涉及利用语言模型将语音转化为文本。
技术介绍
语音识别是利用计算机将由麦克风接收到的声信号转换成一组文本文字、数字或符号的过程。然后可以将这些识别出来的文字用在各种计算机软件应用程序中，以便进行例如文档准备、数据录入、以及提示与控制等。语音识别技术的发展为提高用户工作效率提供了一种重要的途径。语音识别系统可以对声信号进行建模和分类以形成声音模型，这些模型是被称为音素的基本语言单元的表达。一旦接收到该声信号，该语音识别系统分析这些语音信号，在该声信号内识别出一系列语音模型，并且对于给定系列的声音模型得出可能的候选单词列表。随后，语音识别系统可以利用语言模型作为指导对这些可能的候选单词进行上下文分析。具体地说，语言模型可以表示对将单词组合以形成句子所采用的方式的限制。语言模型通常是一种统计模型，该模型能够表示一个单词紧挨着另一个单词或词组出现的可能性。语言模型可以被规定为一个有限状态网络，其中明确地列出了在每个单词后面允许跟随的单词，或是可采用一种对上下文敏感的语法以更加复杂的方式来实现。其它示例性的语言模...

【技术保护点】
一种利用语境模型分级结构来将语音转换成文本的方法，其中所述语境模型分级结构被统计平滑成语言模型，所述方法包括：　　　　（ａ）用多个语境模型来处理文本，其中所述多个语境模型中的每一个对应于所述多个语境模型的分级结构中的节点；　　　　（ｂ）识别出与所述文本相对应的至少一个所述语境模型；并且　　　　（ｃ）用所述识别出的至少一个语境模型来处理随后的用户话语。

【技术特征摘要】
US 2001-3-1 09/798,6551.一种利用语境模型分级结构来将语音转换成文本的方法，其中所述语境模型分级结构被统计平滑成语言模型，所述方法包括(a)用多个语境模型来处理文本，其中所述多个语境模型中的每一个对应于所述多个语境模型的分级结构中的节点；(b)识别出与所述文本相对应的至少一个所述语境模型；并且(c)用所述识别出的至少一个语境模型来处理随后的用户话语。2.如权利要求1所述的方法，其中所述步骤(a)串行或并行进行。3.如权利要求1或2所述的方法，其中所述多个语境模型中的至少一个与以下中的一个或多个对应(i)一份文档或文档的一部分；(ii)在基于对话的系统中在特定对话状态下接收到的至少一个用户响应；(iii)在基于对话的系统中在特定业务内的特定位置接收到的至少一个用户响应；(iv)基于对话的系统中的提示的语法；(v)特定的已知的基于对话系统的提示；或者(vi)所接收的电子邮件消息。4.一种生成语境模型分级结构的方法，所述方法包括(a)利用距离尺度测量多个语境模型中的每一个之间的距离，其中所述多个语境模型中的至少一个对应于基于对话的系统内的文档的一部分或用户响应；(b)识别出所述多个语境模型中的两个，所述被识别出的语境模型在距离上比所述多个语境模型中的其它语境模型更加接近；(c)将所述被识别出的语境模型合并成一母语境模型；(d)重复所述步骤(a)、(b)和(c)直到生成所述多个语境模型的分级结构，所述分级结构具有一根节点；并且(e)对所述多个语境模型的所述分级结构进行统计平滑，从而产生一语言模型。5.如权利要求4所述的...

【专利技术属性】
技术研发人员：马克E爱普斯坦，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人