当前位置: 首页 > 专利查询>余喆专利>正文

自然语音识别方法和装置制造方法及图纸

技术编号:8191474 阅读:257 留言:0更新日期:2013-01-10 02:19
本发明专利技术公开一种自然语音识别方法和装置,涉及语音识别技术。以解决采用关键词的方式进行语音识别成功率较低的问题。包括:获取用户输入的语音信息对应的拼音;采用预先设置的词典对拼音进行分词处理,获取分词后的词语拼音串;从词典中查找词语拼音串对应的待识别词语;根据待识别词语查找目标信息数据库获取与待识别词语匹配度最高的目标信息;其中,词典用于存储进行语音识别的目标词语以及目标词语对应的拼音。本发明专利技术实施例提供的技术方案可以应用在如导航、点歌以及联系人查询等信息服务系统中。

【技术实现步骤摘要】

本专利技术涉及语音识别技术,尤其涉及一种自然语音识别方法和装置
技术介绍
在语音识别领域中,对于不同的语言,语音识别技术各不相同,例如对于英文而言,待进行语音识别的语句中单词均由26个字母表中的字母构成,在进行语音识别时,语音识别系统只需要对语句中的字母进行识别,即可识别出语音信息对应的文本信息。 中文与英文最大的区别在于,中文汉字数量较大,目前,汉字的总数已经超过了 8万,其中常用汉字大约有3500字左右,面对如此庞大的中文汉字库,传统的语音识别技术是基于关键词的,语音识别系统需要将用户发送的语音内容从头到尾按逐字与词表中预先存储的文本内容进行匹配,只有语音内容与词表中存储的某条文本内容完全匹配时,语音识别系统才能识别出用户发送的语音内容的含义,成功进行语音识别,否则,语音识别失败。然而,在实际的生活中,语言表述形式是多种多样的,对于同一事物每个人或者同一人在不同时期的表述各不相同,例如对母亲一词的表述可以包括母亲、妈、妈妈、老妈、妈咪等等。为了提高语音识别的成功率与准确率,需要尽可能地将同一事物的所有表述形式均存储到语音识别系统的词表中,这使得语音识别系统的词表规模非常庞大,维护不方便,并且由于词表规模庞大,使得语音识别系统进行语音识别的速度较慢。另外,由于人们的语言表述形式千差万别,随着时代的发展,语言表达方式也在不断更新,无法在语音识别系统的词表中穷尽同一事物的所有表述形式,使得采用关键词方式进行语音识别的成功率较低。在申请号为CN00130067. 9、CN03123123. 3以及CN03138149. 9等中国专利中也公开了与语音识别相关的技术方案,然而上述技术方案只能进行语音合成或者将语音转换成文字,而无法实现对语音转换成文字信息的识别,并且,上述技术方案是针对英文语音识别设计的,根据以上分析可知,英文语言和中文语言从词语数量以及语法特点上大不相同,使得上述技术方案即使应用在中文语音识别中也无法进行有效的识别,语音识别的成功率较低;在申请号为CN99813093. I的中国专利中,公开了一种采用语音识别和自然语言处理的交互式用户界面,虽然能够实现对语音转换成文字信息的识别,然而该技术方案也是针对英文语言设计的,在进行语音识别的过程中需要考虑语法等因素的影响,仍然无法有效地应用在中文语音识别中。
技术实现思路
为解决上述技术问题,本专利技术的实施例提供一种自然语音识别方法和装置,能够提高中文语音识别速度,以及语音识别的成功率。—种自然语音识别方法,包括获取用户输入的语音信息对应的拼音;采用预先设置的词典对所述拼音进行分词处理,获取分词后的词语拼音串;从所述词典中查找所述词语拼音串对应的待识别词语;根据所述待识别词语查找目标信息数据库,从所述目标信息数据库中获取与所述待识别词语匹配度最高的目标信息;其中,所述词典用于存储进行语音识别的目标词语以及目标词语对应的拼音。一种自然语音识别装置,包括第一获取单元,用于获取用户输入的语音信息对应的拼音;分词处理单元,用于采用预先设置的词典对所述第一获取单元获取的拼音进行分词处理,获取分词后的词语拼音串;第二获取单元,用于从所述词典中查找所述分词处理单元获取的词语拼音串对应的待识别词语; 查找单元,用于根据所述第二获取单元获取的待识别词语查找目标信息数据库, 从所述目标信息数据库中获取与所述待识别词语匹配度最高的目标信息;其中,所述词典用于存储进行语音识别的目标词语以及目标词语对应的拼音。本专利技术实施例提供的自然语音识别方法和装置,根据词语拼音串对应的待识别词语进行信息匹配,并将目标信息数据库中与待识别词语匹配度最高的信息作为对语音信息识别得到的目标信息,不需要对语音信息进行完全匹配即可获得目标信息,提高了语音识别的成功率,解决了现有技术采用对语音信息进行完全匹配方法进行语音识别,造成由于表述方式不一致而使语音识别失败,语音识别成功率低的问题,由于本专利技术实施例提供的技术方案采用词语匹配的方式进行语音识别,只需要在词典中存储目标词语并在目标信息数据库中存储标准信息即可,不需要对同一事物按照语言表述方式存储大量不同形式的文本信息,词典和目标信息数据库的数据规模较小,便于进行查找,进而提高了语音识别速度,解决了现有技术需要在词表中对同一事物存储大量不同表述形式的文本信息,造成词表规模庞大,不便于查找,进行语音识别的速度较慢的问题。本专利技术实施例提供的技术方案不同于英文语音识别技术,该技术方案针对中文语言文字量大,语句中词语连贯、无停顿的特点,采用按照拼音对语句中词语进行分词,并根据分词后的待识别词语查找的方式进行语音识别,对中文语音识别的成功率以及识别速度较高。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图I为本专利技术实施例提供的自然语音识别方法流程图一;图2为图I所示的本专利技术实施例提供的自然语音识别方法步骤104的流程图一;图3为图I所示的本专利技术实施例提供的自然语音识别方法步骤104的流程图二 ;图4为本专利技术实施例提供的自然语音识别方法流程图二 ;图5为本专利技术实施例提供的自然语音识别装置结构示意图一;图6为本专利技术实施例提供的自然语音识别装置结构示意图二 ;图7为本专利技术实施例提供的自然语音识别装置结构示意图三;图8为本专利技术实施例提供的自然语音识别装置结构示意图四;图9为图5所示的本专利技术实施例提供的自然语音识别装置中查找单元的结构示意图;图10为本专利技术实施例提供的自然语音识别装置结构示意图五;图11为本专利技术实施例提供的自然语音识别装置结构示意图六;图12为本专利技术实施例提供的自然语音识别装置结构示意图七。具体实施例方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例,都属于本专利技术保护的范围。为了解决采用关键词的方式进行语音识别成功率较低的问题,本专利技术实施例提供一种自然语音识别方法和装置。如图I所示,本专利技术实施例提供的自然语音识别方法,包括步骤101,获取用户输入的语音信息对应的拼音。为了使本专利技术实施例提供的自然语音识别方法适用范围更广,能够识别出不同地域、不同口音的用户语音信息,在本实施例中,步骤101可以采用非特定人语音识别技术对用户输入的语音信息进行识别解析,获取该语音信息对应的拼音。步骤102,采用预先设置的词典对步骤101获取的拼音进行分词处理,获取分词后的词语拼音串。其中,词典用于存储进行语音识别的目标词语以及目标词语对应的拼音。在本实施例中,词典中存储的目标词语可以是广义范围的词语,具体地,可以从日常生活和工作能够接触到的信息中获取目标词语并形成词典,例如可以从每天新闻报道的信息中提取词语,形成词典;词典中存储的目标词语也可以是狭义范围的词语,具体地,可以从目标信息数据库中存储的信息获取目标词语并形成词典,其中,目标信息数据库用于存储待进行识别的信息本文档来自技高网
...

【技术保护点】
一种自然语音识别方法,其特征在于,包括:获取用户输入的语音信息对应的拼音;采用预先设置的词典对所述拼音进行分词处理,获取分词后的词语拼音串;从所述词典中查找所述词语拼音串对应的待识别词语;根据所述待识别词语查找目标信息数据库,从所述目标信息数据库中获取与所述待识别词语匹配度最高的目标信息;其中,所述词典用于存储进行语音识别的目标词语以及目标词语对应的拼音。

【技术特征摘要】

【专利技术属性】
技术研发人员:余喆
申请(专利权)人:余喆
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1