语音导航设备及语音导航方法技术

技术编号:7222831 阅读:336 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种语音导航设备,包括语音接收单元,用于接收关于导航目的地的语音数据V;关键字数据库,其中存储有n个预设的关键字;地名数据库,其中存储有地名信息的搜索树;语音识别单元,用于根据上述关键字数据库中存储的关键字对语音数据V进行分段,以生成n段语音数据Vi(i=1~n),并采用多段识别的方法与地名数据库中的地名信息的搜索树进行匹配,以将上述语音数据V转换为该语音导航设备可以识别的输入形式;及电子地图,用于根据上述识别的输入形式,可视化地显示出导航目的地的位置与路线。本发明专利技术还提供一种语音导航方法。本发明专利技术可以缩短匹配识别的时间。

【技术实现步骤摘要】

本专利技术涉及一种导航技术,特别是。
技术介绍
当前,由于民用GPS (Global Position System,全球定位系统)技术的开放与发展,GPS技术已经越来越多的应用在民用的定位和导航中。当前大部分的车载导航设备都能够较为准确的指示当前的位置,并根据道路情况显示路线,极大的方便了驾驶者。但是,这些传统的导航设备却很难解决交互的问题。例如,驾驶者为了设置一个目的导航地不得不找个地方停下来,用手输入和查找目的地位置,这使得目的地导航的便捷性打了折扣。为了解决上述问题,具有语音识别功能的语音导航设备应运而生。所述语音识别是将人类语音中的词汇内容转换为电子设备的芯片可识别的输入。这样,驾驶者不需要用手输入和查找目的地位置,而只需发出语音指令即可实现导航设备自动向目的地导航的目的。然而,传统的具有语音识别功能的语音导航设备只能识别一些特殊的地名,如世界之窗、欢乐谷等,而不能对常规地名进行语音识别。此外,传统的语音识别技术在实现将人类的语音转换为电子设备的芯片可识别的输入时所使用的语法规则是将语音指令中的一句话作为一个整体跟模型库中的所有内容匹配一遍。例如,驾驶者发出的语音指令为“A市B区C路D号”,则原始的语法规则是将“A 市B区C路D号”作为一个整体,一次性与地名数据库(/模型库)中所有可能的地名组合匹配一遍。于是,当模型库的规模很大时,进行匹配识别的时间就会很长,严重浪费系统资源及时间。
技术实现思路
鉴于以上内容,有必要提供一种语音导航设备,其将输入的语音数据进行分段,采用多段识别的方法与地名数据库中的内容进行匹配,极大的减少了匹配识别的时间。此外,还有必要提供一种语音导航方法,其将输入的语音数据进行分段,采用多段识别的方法与地名数据库中的内容进行匹配,极大的减少了匹配识别的时间。一种语音导航设备,包括语音接收单元,用于接收关于导航目的地的语音数据V。 该语音导航设备还包括关键字数据库,其中存储有η个预设的关键字,其中,η为大于1的自然数;地名数据库,其中存储有地名信息的搜索树;语音识别单元,用于根据上述关键字数据库中存储的关键字对语音数据V进行分段,以生成η段语音数据Via =工ι),并采用多段识别的方法与地名数据库中的地名信息的搜索树进行匹配,以将上述语音数据V转换为该语音导航设备可以识别的输入形式;及电子地图,用于根据上述识别的输入形式,可视化地显示出导航目的地的位置与路线。一种语音导航方法,包括(a)语音导航设备接收关于导航目的地的语音数据V ; (b)从一个关键字数据库中获取η个预设的关键字,其中,η为大于1的自然数;(c)根据上述关键字对语音数据V进行分段,以生成η段语音数据Viii = ^n) ;(d)利用上述η段语音数据Viii 卜…采用多段识别的方法与地名数据库中的地名信息的搜索树进行匹配,以将上述语音数据V转换为该语音导航设备能够识别的输入形式;及(e)根据上述转换成的输入形式,在语音导航设备的电子地图上可视化地显示出导航目的地的位置与路线。本专利技术提供的将输入的语音数据进行分段,采用多段识别的方法与地名数据库中的内容进行匹配,极大的减少了匹配识别的时间。附图说明图1是本专利技术语音导航设备较佳实施例的硬件架构图。图2是本专利技术语音导航设备较佳实施例中一个地名信息的搜索树的示意图。图3是本专利技术语音导航设备较佳实施例中语音识别单元的功能模块图。图4是本专利技术语音导航设备较佳实施例中利用关键字对语音数据进行分割的示意图。图5是本专利技术语音导航方法较佳实施例的流程图。主要元件符号说明语音导航设备1语音接收单元10语音识别单元11关键字数据库12地名数据库13电子地图14中央处理器15存储单元16关键字获取模块110分割模块111地名信息获取模块112匹配及权值计算模块113路径选择模块114地名整合模块115定位模块11具体实施例方式参阅图1所示,是本专利技术语音导航设备较佳实施例的硬件架构图。该语音导航设备1包括语音接收单元10、语音识别单元11、关键字数据库12、地名数据库13、及电子地图 14。所述的语音接收单元10可以是麦克风,用于接收外界的语音数据V。该语音数据V是驾驶者发出的导航目的地的语音命令。本实施例中,该语音数据V为“A市B区C路D号” 的格式。所述的语音识别单元11包括多个功能模块(详见图幻,用于根据上述关键字数据库12中存储的η个关键字对语音数据V进行分段,以生成η段语音数据Vi (i =工 n),之后采用多段识别的方法与地名数据库13中的地名信息的搜索树进行匹配,以将上述语音数据V转换为该语音导航设备1可以识别的输入形式,并在电子地图14中可视化地显示出导航目的地的位置与路线。其中,η为大于1的自然数。本实施例中,所述关键字数据库12中存储着关键字的波形图。所述关键字可以是用户设定的。本实施例中,所述关键字包括“市”、“区”、“路”、及“号”。参阅图2,是地名数据库13中存储的地名信息的搜索树的示意图。本实施例中, 该搜索树的第一级节点,即根节点为省级单位,如广东省。该搜索树的第二级节点为市级单位,如广东省所包括的广州市、深圳市、珠海市、及东莞市等。该搜索树的第三级节点为区级单位,如深圳市所包括的罗湖区、南山区、及福田区等。该搜索树的的第四级节点为每个区的各条路,如宝安区所包括的油松路、建设路、人民路、及东环二路等。该搜索树的最后一级节点为每个路上的各个号,如东环二路1号、东环二路2号等。此外,所述语音导航设备1还包括用于执行语音识别单元11中各功能模块的中央处理器(central processing unit) 15,以及用于存储语音识别单元11中各功能模块的存储单元16,如硬盘等。参阅图3所示,是本专利技术语音导航设备1较佳实施例中语音识别单元11的功能模块图。所述语音识别单元11包括关键字获取模块110、分割模块111、地名信息获取模块 112、匹配及权值计算模块113、路径选择模块114、地名整合模块115、及定位模块116。所述关键字获取模块110用于从上述关键字数据库12中获取关键字的波形图。所述分割模块111用于将语音数据V中每个字的波形与关键字的波形进行比较, 当语音数据V中某个字的波形与其中一个关键字的波形相匹配时,从该字之后对语音数据 V进行分割,从而生成η段语音数据vi(i = i η)。参阅图4所示,关键字数据库12中存储有关键字“市”、“区”、“路”、及“号”的波形图。该分割模块111从语音数据V中第一个字的波形开始与上述几个关键字的波形进行比较,当语音数据V中某个字的波形与关键字“市”相匹配时,该分割模块111在该字之后对语音数据V进行分割。继续地,所述分割模块111将语音数据V中其余字的波形与余下的几个关键字的波形进行比较,当语音数据V中某个字的波形与关键字“区”的波形相匹配时,所述分割模块111在该字之后进行分割。如此直至语音数据V中每个字的波形都与上述关键字进行了匹配。所述地名信息获取模块112用于从地名数据库13中获取地名信息的搜索树。所述匹配及权值计算模块113用于从该搜索树的根节点开始执行遍历操作与上述η段语音数据中的第一段语音数据V1进行匹配,计算该根节点的每个子节点与上述语音数据V1的匹配度的权值,作为每个子节点的权值,本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:龚贻华丁国治吕启明
申请(专利权)人:国基电子上海有限公司鸿海精密工业股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术