在中文语音识别系统中识别字母/数字串的方法技术方案

技术编号：2888491 阅读：413 留言：0更新日期：2012-04-11 18:40

一种在中文语音识别系统中识别字母／数字串的方法。该方法选取特殊的编码方案，用由多个汉字组成的、便于记忆和识别的成语和词来表示要输入的每个字母、数字或命令。对于每个阿拉伯数字，用起始为该数字所对应的汉字的成语或词来表示。对于每个英文字母，用起始汉字的汉语拼音的头拼为该英文字母的成语和词来表示。如果有必须包括的命令，也可用意义近似的成语或词来表示。这样就可以解决中文语音识别系统中字母／数字串的不可靠识别问题。（*该技术在2017年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术一般涉及汉字语音识别技术，更具体地说，涉及在中文语音识别系统中识别字母/数字串的技术。随着现代科学和计算机技术的发展，人与机器之间的信息交换变得越来越更重要了。传统的信息交换方式主要是通过键盘输入，通过显示器或打印机输出。在进行汉字输入时，还得记住汉字编码。这种传统的方式非常不方便。如果计算机能获得象人一样的用声音进行信息交流的能力，那么，人与计算机之间便可以通过声音进行对话，这将使人机之间的信息交流发生根本性的变化，能大大提高信息处理的效率。目前在计算机工作者的努力下，已开发各种该音识别系统，特别是汉字语音识别系统。因为汉字通常具有多个同音或近音字，所以在现有的汉字语音识别系统中人们借助词、词组或高层语言信息来解决汉字级上的歧义性，以便正确识别出每个汉字。人们一般使用声音模型来确定对应于输入的音节的最大可能汉字是什么，而且储存有高层语音使用模式信息和概率信息的字典或语言模型来解决汉字级上的歧义性。然而，在脱离上下文环境的情况下，识别单个汉字是非常困难的，其识别结果通常是给出一些具有相同或相似发音的汉字。特别是，在汉字语音识别系统中通过语音输入随机阿拉伯数字或单个英文字母时，无法将其与同音或近音的汉字区分开来。一般来说，汉字语音识别系统通常没有受过识别英文字母的训练，且人们对英文字母的发音也各不相同。综上所述，需要一种在汉字语音识别系统中能可靠识别字母/数字串的方法。根据本专利技术的在中文语音识别系统中识别字母/数字串方法，包括以下步骤·选取一种编码方案，在该方案中用由多个汉字组成的、便于记忆和识别的成语或词，在此称为编码词，来表示要输入的...

【技术保护点】
一种在中文语音识别系统中识别字母／数字串的方法，其特征在于以下步骤： .选取一种编码方案，在该方案中用由多个汉字组成的、便于记忆和识别的成语或词，在此称为编码词，来表示要输入的每个字母、数字或命令； .建立特殊的词汇表，表中每一个词是一个数字、字母或命令，而该词的注音则是其对应编码词的拼音； .接收一个通过编码词的语音Ｓ输入的字母数字或命令，并记录该语音所处的上下文Ｈ； .根据声学模型和语言模型，对照特殊的词汇表确定出输入的字母、数字或命令。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员：唐道南，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人