用于识别孤立、非相关汉字的语音识别方法和系统技术方案

技术编号:2888492 阅读:172 留言:0更新日期:2012-04-11 18:40
一种可以识别弧立、非相关汉字的语音识别方法和系统。所述方法使用各种类型的汉字描述语言来描述要输入的弧立、非相关汉字,而所述的语音识别系统使用基于汉字描述语言(CDL)的识别器接收人们通过语音输入的各种类型汉字描述语言,在运用CDL语法分析器对其进行分析的基础上由汉字发生器根据分析结果产生相应的汉字。这样,在脱离上下文环境的情况下,也可以可靠地识别出孤立、非相关的汉字。(*该技术在2017年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术一般涉及汉字语音识别技术,更具体地说,涉及孤立、非相关汉字的语音识别技术。随着现代科学和计算机技术的发展,人与机器之间的信息交换变得越来越重要了。传统的信息交换方式主要是通过键盘输入,通过显示器或打印机输出。在进行汉字输入时,还得记住汉字编码。这种传统的方式非常不方便。如果计算机能获得象人一样的用声音进行信息交流的能力,那么,人与计算机之间便可以通过声音进行对话,这将使人机之间的信息交流发生根本性的变化,能大大提高信息处理的效率。目前在计算机工作者的努力下,已开发出各种语音识别系统。因为汉字通常具有多个同音或近音字,所以在现有的汉语识别系统中人们借助词、词组或高层语言信息来解决汉字级上的歧义性,以便正确识别出每个汉字。人们一般使用声音模型来确定对应于输入的音节的最大可能汉字是什么,而用词典和储存有高层语言使用模式信息的语言模型来解决汉字级上的歧义性。然而,在脱离上下文环境的情况下,识别孤立、非相关汉字是非常困难的。其识别结果通常是给出一组具有相同或相似发音的汉字。这样在输入人名、地名等不具有高层语言信息的情况下,语音输入变得极不可靠。另外,当现有的语音识别系统给出的识别结果中包含错误的汉字时,希望能借助语音输入来修改。综上所述,需要一种智能输入方案以解决在汉语识别系统中一个或多个不相关汉字的识别问题。根据本专利技术的第一个方面提供一种在中文语音识别系统中识别孤立、非相关汉字的方法,该方法包括步骤·用各种类型的汉字描述语言来描述要输入的孤立、非相关汉字;·对输入的汉字描述语言进行语法分析;·根据分析结果产生相应的孤立、非相关汉字。根据本专利技术的第二个方面提供一种可以识别孤立、非相关汉字的语音识别系统,该系统包括基于汉字描述语言的语言识别器,用于接收人们通过语音输入的各种类型汉字描述语言;CDL语法分析器,对输入的汉字描述语言进行语法分析;和,汉字发生器,根据CDL语法分析器分析的结果产生相应的孤立、非相关汉字。本专利技术可以解决汉字语音识别系统中,当通过语音输入一个或多个不相关汉字时,所产生的不可靠识别问题。通过以下结合附图的说明,会使本专利技术的优点更加明确。附图说明图1是根据本专利技术的语音识别系统的功能方框图;图2是图1中所示的基于CDL语法的语音识别器的功能方框图;图3为一流程图,说明如何使用基于CDL语法的语言模型;图4用于解释图1中所示的CDL语法分析器和汉字发生器工作原理;图5为一流程图,说明如何对输入的汉字描述语言进行语法分析以产生相应的孤立、非相关汉字。根据本专利技术的一个实施例,可将汉字描述语言分为以下几类A借助人们常用的特定词来描述一孤立、非相关的汉字。在此我们记为Type A=(W),其中“W”表示特定的词。该词实际上表明一汉字或偏旁部首,例如“mu4 zi3 li3(木子李)”表示“李”,“kou3tian1 wu2(口天吴)”表示“吴”,“cao3 zi4 tou2(草字头)”表示“艹”。大多数汉字的偏旁部首或用于姓氏等的汉字都可以用A类描述语言来描述。B借助构词来描述一个汉字。在此我们记为Type B=(W“de(的)”C)。这类描述语言以某一词开头,其后跟着汉字“de的”,然后是该词中的一个字。当用户试图输入单个汉字时,用户可以使用包含该字的某一词来标识它。这样的词理想上应是在声音上易识别的字典中的条目,如日常使用的词、成语、通用名称等。例如“tai2 wan2 detai2(台湾的台)”用于标识“tai2(台)”,“tai2 dou2 de tai2(抬头的抬)”用于标识“tai2(抬)”,“bao3 bei4 de bei4(宝贝的贝)”用于标识“bei4(贝)”,“zhun3 bei4 de bei4(准备的备)”用于标识“bei4(备)”,“mo4 ming2 qi2 miao4 de mo4(莫名其妙的莫)”用于标识“mo4(莫)”,“deng4 xiao3 ping2 de deng4(邓小平的邓)”用于标识“deng4(邓)”等等。通常类型B中的“C”也可以用来描述多个汉字。例如“deng4 xiao3 ping2 de xiao3 ping2(邓小平的小平)”用于标识“xiao3 ping2(小平)”,而“da4 cai2 xiao3 yong4 deda4 cai2(大材小用的大材)”用于标识“da4 cai2(大材)”。C借助汉字的结构信息来描述汉字。汉语是表意字符,大多数汉字可以分解成简单汉字和偏旁部首。于是我们或者可以从一复杂的汉字中减去不需要的部分或者将简单的汉字和偏旁部首加在一起而得到所需的汉字。当找不能包含所希望汉字的词时,可以使用这类描述语言,或者当用户不知道汉字的发音时,也可以使用这类描述语言。根据不同用途,可将C类描述语言进一步细分成C1使用其在复杂汉字中的位置来说明一汉字。在此我们记为Type C1=(cd“de(的)”pos),其中“cd”描述一汉字(或偏旁部首在下文中我们不对它们进行区分),而“pos”是一位置词。我们使用“cd”代替汉字C本身,是因为对C的识别可能不可靠。位置词“pos”可以是“zuo3 bian1(左边)”“you4 bian1(右边)”,“shang4mian4(上面)”,“li3 mian4(里面)”,“zhong1 jian1(中间)”等等。例如,“xing2 zheng4 juan4 de xing2 de you4 bian1(行政院的行的右边)”用于描述“chu4(亍)”。C2从一汉字中去掉一成份形成一新的汉字。在此我们记为“TypeC2=(cd1 pos“qu4 diao4(去掉)”cd2)。例如ye3 xu3 de ye3 zhong1jian1 qu4 diao4 yj2 shu4(也许的也中间去掉一竖)”用来描述乜。位置词是任选的。C3增加一些成份(汉字或偏旁部首)形成一个更复杂的汉字。类型C3的形式是(pos1“shi4(是)”cd1,pos2“shi4(是)”cd2…),用于指明每个汉字成份在最终形成汉字中的位置。例如“zuo3 bian1 shi4ti2 shou3 pang2,you4 bian1 shi4 wu2 chan3 jie1 ji2 de wu2(左边是提手旁,右边是无产阶级的无)”用于标识“fu3(抚)”。注意,第一子句中cd1是类型A,而第二子句中的cd2是类型B。类型C3可以有许多种变化,例如,“shang4 mian4 he2 shan1 po1 de shan1 yi2 yang4,xia4 mian4 shi4 yi2 ge4 gu4 ti3 de gu4(上面和山坡的山一样,下面是一个固体的固)”用手描述“gu4(崮)”,“san2 dian3 shui3 jia1 shang4ge4 li4 zao3 zhang1(三点水加上个立早章)”用于描述“zhang1(漳)”。正如这些例子所示出的,类型C3的句法可以覆盖自然语言的大多数模式。这将增强用户友好性。D.借助字义来描述一个字符。在此我们记为Type=(C“yi4 si1shi4(意思是)”W)。例如,“jin3 yi4 si1 shi4 yu4 shi2(瑾意思是玉石)”由此给出“jin3(瑾)本文档来自技高网...

【技术保护点】
一种在中文语音识别系统中识别孤立、非相关汉字的方法,其特征在于以下步骤:.用各种类型的汉字描述语言来描述要输入的孤立、非相关汉字;.对输入的汉字描述语言进行语法分析;.根据分析结果产生相应的孤立、非相关汉字。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:唐道南朱晓瑾沈丽琴
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1