汉语语音识别词库的处理方法技术

技术编号:2878952 阅读:213 留言:0更新日期:2012-04-11 18:40
一种汉语语音识别词库的处理方法,它将词语与由识别基元组成的该词语的识别基元序列进行匹配后添加到语音识别词库之中;并且具体包括有拼音指导下的添加和没有拼音指导下的添加方法;此外,还进一步包括修改、删除该语音识别词库中词语的方法;本发明专利技术克服了现有技术的不足,即在加入新词条时,只需一次输入,无需训练,就可以方便地使用,适用于非特定人识别,具有语音的快捷、人性化的优点;同时,本发明专利技术还适用于在具有精简键盘设备上利用语音输入的方式,有利于管理语音识别词库中的词条,提高了在具有精简键盘设备上加入、读取、修改、删除汉字的效率。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种,适用于在使用语音识别技术的小键盘设备(如手机、固定电话、个人数字助理(Personal DigitalAssistant,简称PDA)、电子辞典)和各类嵌入式系统中,进行有限的词或短语识别时管理语音识别词库词条的方法。语音识别作为IT领域深层次发展的战略性和基础性技术,可以应用于任何需要人机交互的产品,它将改变人类使用键盘、鼠标等使用计算机的方式,特别是满足各种移动终端如手机、掌上电脑因其移动性、手持化而产生的新的交互方式的需求。各种形态的嵌入式的计算设备也将借助这一技术改变单一界面,以更丰富友好和人性化的方式出现。但是,在手机、掌上电脑等小键盘设备上使用语音识别技术,进行命令词识别和短语识别(可以统称为孤立词识别)时,常常会遇到添加新词条或修改旧词条等问题。这就关系到进行系统内部的语音识别词库管理。如何方便快捷全面的实现语音识别词库管理,是语音识别应用上的一个难题。现有技术对于上述问题的解决方案是当用户需要加入新词时,需要反复录入该词的语音样本并进行训练达到对新词条的添加和旧词条的修改。但是这种方法最终只能实现对特定人识别,不具有广泛应用的价值。另外一些系统对数据的更新,则需要得到产品生产方的帮助,才能使加入的词可以支持非特定人识别。在语音识别系统中,用户输入语音希望得到与之对应的正确文字;但是,参看表1,由于识别方面的原因,实际得到的识别结果通常不是最终的文字,而是与识别系统中模型相对应的一些识别基元或基元编号信息,例如音节,半音节(声/韵母),音素和语音状态等。表1 因此,如果将所述的识别基元和要识别的文字相对应,则在识别过程中仅需查找到该识别基元对应的文字,再经过确认就可以快捷地通过语音方式输入汉字。为此需要建立具有上述识别基元和对应文字的汉语语音识别系统词表,并对该表进行语句添加、修改、删除等处理。本专利技术的另一目的在于提供一种修改汉语语音识别系统词表的方法,特别适用于在具有精简键盘设备上利用语音输入的方式,管理语音识别词库中的词条,提高在具有精简键盘设备上加入、读取、修改、删除汉字的效率。本专利技术的目的是这样实现的一种;将词语与由识别基元组成的该词语的识别基元序列进行匹配,然后添加到语音识别词库之中。上述的方法具体可以为有拼音指导的处理过程,具体的步骤为步骤10通过语音或者拼音方法输入一个词语及其发音;步骤11记录该词语和它所对应的拼音;步骤12如果词语输入没有结束,则执行步骤10;步骤13将该词语的拼音序列转换为识别基元序列;步骤14如果语音识别词库中已经存在该词语,则结束;步骤15将该词语的字序列和识别基元序列一同添加到语音识别词库之中。上述的方法具体也可以为无拼音指导的处理过程,具体的步骤为步骤20输入一个词语的汉字序列;步骤21如果输入者不对该词语进行识别确认,则执行步骤23;步骤22根据输入者的选择对所有可能的识别基元序列进行处理,结束;步骤23自动逐个处理所有可能的识别基元序列,结束。上述的步骤22具体为步骤220找到该词语字序列所有可能的识别基元序列,并将第一个识别基元序列作为当前处理的识别基元序列;步骤221如果输入者不选择保留,则执行步骤224;步骤222如果语音识别词库中已经存在该词语,则执行步骤224;步骤223将该词语的字序列和相应的识别基元序列添加到语音识别词库之中;步骤224如果没有需要处理的识别基元序列,则结束;步骤225将下一个要处理的识别基元序列作为当前处理的识别基元序列,执行步骤221。该图所述的步骤22具体为步骤220’找到该词语字序列所有可能的拼音序列,并将第一个拼音序列作为当前处理的拼音序列;步骤221’如果输入者不选择保留,则执行步骤225’;步骤222’将该词语的拼音序列转换为识别基元序列;步骤223’如果语音识别词库中已经存在该词语,则执行步骤225’;步骤224’将该词语的字序列和相应的识别基元序列添加到语音识别词库之中;步骤225’如果没有需要处理的拼音序列,则结束;步骤226’将下一个要处理的拼音序列作为当前处理的拼音序列,执行步骤221’。上述的步骤23具体为步骤230列出该词语字序列的所有可能的识别基元序列,并将第一个识别基元序列作为当前要处理的识别基元序列;步骤231如果语音识别词库中已经存在该词语,则执行步骤233;步骤232将该词语的字序列和相应的识别基元序列添加到语音识别词库之中;步骤233如果没有需要处理的识别基元序列,则结束;步骤234将下一个要处理的识别基元序列作为当前处理的识别基元序列,执行步骤231。修改词库中已有词语的具体过程为步骤30从语音识别词库中找到要修改的词语;步骤31显示该词语的字序列;步骤32显示该词语字序列对应的识别基元序列;步骤33如果不修改该词语,则结束;步骤34修改该词语的字序列并修改对应的识别基元序列;步骤35将修改后的该词语的字序列和相应的识别基元序列重新存入语音识别词库。修改词库中已有词语的过程也可以为步骤30’从语音识别词库中找到要修改的词语;步骤31’显示该词语的字序列;步骤32’将识别基元序列转换为拼音序列;步骤33’显示该词语对应的拼音序列;步骤34’如果不修改该词语,则结束;步骤35’修改该词语的字序列和对应的拼音序列;步骤36’将该拼音序列转换为识别基元序列;步骤37’将修改后的该词语的字序列和相应的识别基元序列重新存入语音识别词库。删除语音识别词库中已有词语的过程具体为步骤40从语音识别词库中找到要删除的词语;步骤41显示该词语的字序列;步骤42显示该词语字序列对应的识别基元序列;步骤43如果不删除该词语,则结束;步骤44从语音识别词库中删除该词语的字序列及识别基元序列。删除语音识别词库中已有词语的过程也可以为步骤40’从语音识别词库中找到要删除的词语;步骤41’显示该词语的字序列;步骤42’将该词语对应的识别基元序列转换为拼音序列;步骤43’显示该词语字序列对应的拼音序列;步骤43’如果不删除该词语,则结束;步骤44’从语音识别词库中删除该词语的字序列及对应的拼音序列。上述的拼音序列转换为识别基元序列的具体步骤为 步骤101将拼音序列中的第一个拼音作为当前转换的拼音,并清空识别基元序列;步骤102在拼音到识别基元词典中查找该拼音;步骤103如果没有找到该拼音,进行错误处理,执行步骤105;步骤104将该拼音对应的识别基元添加到识别基元序列之中;步骤105如果所有的拼音均转换完毕,将拼音序列中下一个拼音作为当前转换的拼音,执行步骤102;步骤106结束。上述的识别基元序列转换为拼音序列的步骤具体为步骤201将识别基元序列中的第一个识别基元作为当前转换的识别基元,并清空拼音序列;步骤202在识别基元到拼音词典中查找该识别基元;步骤203如果没有找到该识别基元,进行错误处理,执行步骤205;步骤204将该识别基元对应的拼音添加到拼音序列之中;步骤205如果所有的识别基元均转换完毕,将识别基元序列中下一个识别基元作为当前转换的识别基元,执行步骤202;步骤206结束。上述的识别基元序列包括一个或一个以上的识别基元,并且,所述的识别基元也可以为识别基元编号,该识别基元与识别基元编号一一对应。本专利技术的方法克服了现有技术的不足,即在加入本文档来自技高网...

【技术保护点】
一种汉语语音识别词库的处理方法,其特征在于:将词语与由识别基元组成的该词语的识别基元序列进行匹配,然后添加到语音识别词库之中。

【技术特征摘要】

【专利技术属性】
技术研发人员:张向东李全在侯震柴云霞
申请(专利权)人:北京南山高科技有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利