当前位置: 首页 > 专利查询>余喆专利>正文

自然语音识别方法和装置制造方法及图纸

技术编号：8191474 阅读：257 留言：0更新日期：2013-01-10 02:19

本发明专利技术公开一种自然语音识别方法和装置，涉及语音识别技术。以解决采用关键词的方式进行语音识别成功率较低的问题。包括：获取用户输入的语音信息对应的拼音；采用预先设置的词典对拼音进行分词处理，获取分词后的词语拼音串；从词典中查找词语拼音串对应的待识别词语；根据待识别词语查找目标信息数据库获取与待识别词语匹配度最高的目标信息；其中，词典用于存储进行语音识别的目标词语以及目标词语对应的拼音。本发明专利技术实施例提供的技术方案可以应用在如导航、点歌以及联系人查询等信息服务系统中。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别技术，尤其涉及一种自然语音识别方法和装置。
技术介绍
在语音识别领域中，对于不同的语言，语音识别技术各不相同，例如对于英文而言，待进行语音识别的语句中单词均由26个字母表中的字母构成，在进行语音识别时，语音识别系统只需要对语句中的字母进行识别，即可识别出语音信息对应的文本信息。中文与英文最大的区别在于，中文汉字数量较大，目前，汉字的总数已经超过了 8万，其中常用汉字大约有3500字左右，面对如此庞大的中文汉字库，传统的语音识别技术是基于关键词的，语音识别系统需要将用户发送的语音内容从头到尾按逐字与词表中预先存储的文本内容进行匹配，只有语音内容与词表中存储的某条文本内容完全匹配时，语音识别系统才能识别出用户发送的语音内容的含义，成功进行语音识别，否则，语音识别失败。然而，在实际的生活中，语言表述形式是多种多样的，对于同一事物每个人或者同一人在不同时期的表述各不相同，例如对母亲一词的表述可以包括母亲、妈、妈妈、老妈、妈咪等等。为了提高语音识别的成功率与准确率，需要尽可能地将同一事物的所有表述形式均存储到语音识别系统的词表中，这使得语音识别系统的词表规模非常庞大，维护不方便，并且由于词表规模庞大，使得语音识别系统进行语音识别的速度较慢。另外，由于人们的语言表述形式千差万别，随着时代的发展，语言表达方式也在不断更新，无法在语音识别系统的词表中穷尽同一事物的所有表述形式，使得采用关键词方式进行语音识别的成功率较低。在申请号为CN00130067. 9、CN03123123. 3以及CN03138149. 9等中国专利中也公开了与语音识别相关...

【技术保护点】
一种自然语音识别方法，其特征在于，包括：获取用户输入的语音信息对应的拼音；采用预先设置的词典对所述拼音进行分词处理，获取分词后的词语拼音串；从所述词典中查找所述词语拼音串对应的待识别词语；根据所述待识别词语查找目标信息数据库，从所述目标信息数据库中获取与所述待识别词语匹配度最高的目标信息；其中，所述词典用于存储进行语音识别的目标词语以及目标词语对应的拼音。

【技术特征摘要】

【专利技术属性】
技术研发人员：余喆，
申请(专利权)人：余喆，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人