汉语语音识别词库的处理方法技术

技术编号：2878952 阅读：213 留言：0更新日期：2012-04-11 18:40

一种汉语语音识别词库的处理方法，它将词语与由识别基元组成的该词语的识别基元序列进行匹配后添加到语音识别词库之中；并且具体包括有拼音指导下的添加和没有拼音指导下的添加方法；此外，还进一步包括修改、删除该语音识别词库中词语的方法；本发明专利技术克服了现有技术的不足，即在加入新词条时，只需一次输入，无需训练，就可以方便地使用，适用于非特定人识别，具有语音的快捷、人性化的优点；同时，本发明专利技术还适用于在具有精简键盘设备上利用语音输入的方式，有利于管理语音识别词库中的词条，提高了在具有精简键盘设备上加入、读取、修改、删除汉字的效率。（*该技术在2022年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种，适用于在使用语音识别技术的小键盘设备(如手机、固定电话、个人数字助理(Personal DigitalAssistant，简称PDA)、电子辞典)和各类嵌入式系统中，进行有限的词或短语识别时管理语音识别词库词条的方法。语音识别作为IT领域深层次发展的战略性和基础性技术，可以应用于任何需要人机交互的产品，它将改变人类使用键盘、鼠标等使用计算机的方式，特别是满足各种移动终端如手机、掌上电脑因其移动性、手持化而产生的新的交互方式的需求。各种形态的嵌入式的计算设备也将借助这一技术改变单一界面，以更丰富友好和人性化的方式出现。但是，在手机、掌上电脑等小键盘设备上使用语音识别技术，进行命令词识别和短语识别(可以统称为孤立词识别)时，常常会遇到添加新词条或修改旧词条等问题。这就关系到进行系统内部的语音识别词库管理。如何方便快捷全面的实现语音识别词库管理，是语音识别应用上的一个难题。现有技术对于上述问题的解决方案是当用户需要加入新词时，需要反复录入该词的语音样本并进行训练达到对新词条的添加和旧词条的修改。但是这种方法最终只能实现对特定人识别，不具有广泛应用的价值。另外一些系统对数据的更新，则需要得到产品生产方的帮助，才能使加入的词可以支持非特定人识别。在语音识别系统中，用户输入语音希望得到与之对应的正确文字；但是，参看表1，由于识别方面的原因，实际得到的识别结果通常不是最终的文字，而是与识别系统中模型相对应的一些识别基元或基元编号信息，例如音节，半音节(声/韵母)，音素和语音状态等。表1 因此，如果将所述的识别基元和要识别的文字相对应...

【技术保护点】
一种汉语语音识别词库的处理方法，其特征在于：将词语与由识别基元组成的该词语的识别基元序列进行匹配，然后添加到语音识别词库之中。

【技术特征摘要】

【专利技术属性】
技术研发人员：张向东，李全在，侯震，柴云霞，
申请(专利权)人：北京南山高科技有限公司，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人