语音识别方法和装置制造方法及图纸

技术编号:7918316 阅读:248 留言:0更新日期:2012-10-25 03:11
本发明专利技术公开了一种语音识别方法和装置,涉及语音识别技术。为解决现有技术语音识别速度慢的问题而发明专利技术。本发明专利技术实施例提供的技术方案包括:获取用户输入的语音信息对应的文字信息;采用预设的目标信息数据库和负载库对所述文字信息进行分词处理,获取目标信息数据库对应的目标信息,所述目标信息数据库用于存储待进行语音识别的信息,所述负载库用于存储除具有实质含义的词语外的信息;根据所述目标信息确定所述语音信息的内容。本发明专利技术实施例可以应用在如导航、点歌以及联系人查询等信息服务系统中。

【技术实现步骤摘要】

本专利技术涉及语音识别技术,尤其涉及一种语音识别方法和装置
技术介绍
随着计算机与信息技术的持续发展,语音交互已经成为人机交互的必要手段。作为语音交互的重要技术之一,语音识别技术经过近半个世纪的发展,已日趋成熟,并得到广泛的应用。由于中文汉字和词汇的数量较大,为了提高汉语语音识别系统的准确率,传统的语音识别系统需要将用户发送的语音内容从头到尾按字/词的方式与文本库中预先存储的文本内容进行逐一匹配,只有语音内容与文本库中存储的某条文本内容完全匹配时,语音识别系统才能识别出用户发送的语音内容的含义,成功进行语音识别,否则,语音识别失败。然而,在实际的生活中,语言表述形式是多种多样的,对于同一事物每个人或者同一人在不同时期的表述各不相同,以问路为例,问路的表述方式既可以为“请问西直门怎么走”,也可以为“请问到西直门怎么走”,还可以为“西直门怎么走”、“怎么去西直门”等。为了提高语音识别的成功率与准确率,需要尽可能地将不同事物的所有表述形式均存储到语音识别系统的文本库中,这使得语音识别系统的文本库规模非常庞大,维护不方便;并且由于文本库规模庞大,使得语音识别系统进行语音识别的速度较慢
技术实现思路
为解决上述技术问题,本专利技术实施例提供一种语音识别方法和装置,能够提高语音识别的速度。一方面,提供一种语音识别方法,包括获取用户输入的语音信息对应的文字信息;采用预设的目标信息数据库和负载库对所述文字信息进行分词处理,获取目标信息数据库对应的目标信息,所述目标信息数据库用于存储待进行语音识别的信息,所述负载库用于存储除具有实质含义的词语外的信息;根据所述目标信息确定所述语音信息的内容。另一方面,提供一种语音识别方法,包括获取用户输入的语音信息对应的文字信息;采用预设的词典和负载库对所述文字信息进行分词处理,获取所述词典对应的目标词语,所述词典用于存储待进行语音识别的词语,所述负载库用于存储除具有实质含义的词语外的信息;根据所述目标词语查找目标信息数据库,从所述目标信息数据库中获取与所述目标词语匹配度最高的目标信息,所述目标信息数据库用于存储待进行语音识别的信息;根据所述目标信息确定所述语音信息的内容。又一方面,提供一种语音识别方法,包括获取用户输入的语音信息对应的拼音;采用预设的目标信息数据库和负载库对所述拼音进行分词处理,获取分词后的词语拼音串;所述目标信息数据库用于存储待进行语音识别的信息;所述负载库用于存储除具有实质含义的词语外的信息;根据所述词语拼音串从所述目标信息数据库中获取对应的目标信息;根据所述目标信息确定所述语音信息的内容。再一方面,提供一种语音识别方法,包括获取用户输入的语音信息对应的拼音;采用预设的词典和负载库对所述拼音进行分词处理,获取分词后的词语拼音串;所述词典用于存储待进行语音识别的词语;所述负载库用于存储除具有实质含义的词语外的信息;根据所述词语拼音串从所述词典中获取对应的目标词语;根据所述目标词语查找目标信息数据库,从所述目标信息数据库中获取与所述目标词语匹配度最高的目标信息;所述目标信息数据库用于存储待进行语音识别的信息;根据所述目标信息确定所述语音信息的内容。 一方面,提供一种语音识别装置,包括文字获取单元,用于获取用户输入的语音信息对应的文字信息;分词单元,用于采用预设的目标信息数据库和负载库对所述文字信息进行分词处理,获取目标信息数据库对应的目标信息;所述目标信息数据库用于存储待进行语音识别的信息;所述负载库用于存储除具有实质含义的词语外的信息;内容确定单元,用于根据所述目标信息确定所述语音信息的内容。另一方面,提供一种语音识别装置,包括文字获取单元,用于获取用户输入的语音信息对应的文字信息;分词单元,用于采用预设的词典和负载库对所述文字信息进行分词处理,获取所词典对应的目标词语;所述词典用于存储待进行语音识别的词语;所述负载库用于存储除具有实质含义的词语外的信息;目标信息获取单元,用于根据所述目标词语查找目标信息数据库,从所述目标信息数据库中获取与所述目标词语匹配度最高的目标信息,所述目标信息数据库用于存储待进行语音识别的信息;内容确定单元,用于根据所述目标信息确定所述语音信息的内容。又一方面,提供一种语音识别装置,包括拼音获取单元,用于获取用户输入的语音信息对应的拼音;分词单元,用于采用预设的目标信息数据库和负载库对所述拼音进行分词处理,获取分词后的词语拼音串;所述目标信息数据库用于存储待进行语音识别的信息;所述负载库用于存储除具有实质含义的词语外的信息;目标信息获取单元,用于根据所述词语拼音串从所述目标信息数据库中获取对应的目标信息;内容确定单元,用于根据所述目标信息确定所述语音信息的内容。再一方面,提供一种语音识别装置,包括拼音获取单元,用于获取用户输入的语音信息对应的拼音;分词单元,用于采用预设的词典和负载库对所述拼音进行分词处理,获取分词后的词语拼音串;所述词典用于存储待进行语音识别的词语;所述负载库用于存储除具有实质含义的词语外的信息;目标词语获取单元,用于根据所述词语拼音串从所述词典中获取对应的目标词语;目标信息获取单元,用于根据所述目标词语查找目标信息数据库,从所述目标信息数据库中获取与所述目标词语匹配度最高的目标信息;所述目标信息数据库用于存储待进行语音识别的信息;内容确定单元,用于根据所述目标信息确定所述语音信息的内容。 本专利技术实施例提供的语音识别方法和装置,采用目标信息数据库和负载库对文字信息进行分词,获取目标信息数据库对应的目标信息并确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定文字信息中无实质含义的信息,从而可以更准确的根据目标信息数据库确定对应的目标信息,进而提高语音识别的准确率。本专利技术实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图I为本专利技术实施例一提供的语音识别方法的流程图;图2为本专利技术实施例二提供的语音识别方法的流程图;图3为本专利技术实施例三提供的语音识别方法的流程图;图4为本专利技术实施例四提供的语音识别方法的流程图;图5为本专利技术实施例五提供的语音识别方法的流程图;图6为本专利技术实施例六提供的语音识别方法的流程图;图7为本专利技术实施例七提供的语音识别装置的结构示意图一;图8为图7所示的语音识别装置中分词单元的结构示意图;图9为图7所示的语音识别装置的结构示意图二 ;图10为本专利技术实施例八提供的语音识别装置的结构示意图;图11为本专利技术实施例九提供的语音识别装置的结构示意图;图12为本专利技术实施例十提供的语音识别装置的结构示意图。具体实施例方式下面将本文档来自技高网...

【技术保护点】
一种语音识别方法,其特征在于,包括:获取用户输入的语音信息对应的文字信息;采用预设的目标信息数据库和负载库对所述文字信息进行分词处理,获取目标信息数据库对应的目标信息,所述目标信息数据库用于存储待进行语音识别的信息,所述负载库用于存储除具有实质含义的词语外的信息;根据所述目标信息确定所述语音信息的内容。

【技术特征摘要】

【专利技术属性】
技术研发人员:王力劭许军庞泽耀邵颖王钢
申请(专利权)人:深圳市车音网科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1