语音识别装置及导航装置制造方法及图纸

技术编号:9798538 阅读:82 留言:0更新日期:2014-03-22 13:31
本发明专利技术所涉及的语音识别装置包括:语音获取部(1),该语音获取部(1)对所输入的语音进行数字转换,并作为语音数据来获取该数据;语音数据存储部(2),该语音数据存储部(2)对语音获取部(1)所获取的语音数据进行存储;第一~第M语音识别部,该第一~第M语音识别部从语音数据存储部(2)所存储的语音数据中检测语音区间,提取出语音区间的语音数据的特征量,基于所提取出的特征量并参照识别词典来进行识别处理;语音识别切换部(4),该语音识别切换部(4)对第一~第M语音识别部进行切换;识别控制部(5),该识别控制部(5)对语音识别切换部(4)所进行的语音识别部的切换进行控制,以获取切换后的语音识别部的识别结果;以及识别结果选择部(6),该识别结果选择部(6)从识别控制部(5)所获取的识别结果中选择提示给用户的提示对象的识别结果。

【技术实现步骤摘要】
【国外来华专利技术】语音识别装置及导航装置
本专利技术涉及语音识别装置及包括该装置的导航装置。
技术介绍
在现有的车载导航装置中,一般具有语音输入Ι/F以实现对地址、设施名称进行语音识别的功能。然而,由于安装作为车载导航装置的硬件的工作存储器及运算能力的限制、识别率的问题,有时难以将地址、设施名称等大量的词汇作为一次性识别的对象。对此,例如在专利文献I中,公开了一种将语音识别对象进行分割以分多次实施识别的语音识别装置。在该装置中,将语音识别对象进行分割并依次进行语音识别,若识别结果的识别分值(匹配度)在阈值以上,则确定其识别结果并结束处理。另外,当识别分值在上述阈值以上的识别结果一个也没有时,将所获得的识别结果中识别分值最高的识别结果作为最终的识别结果。这样,能通过将语音识别对象进行分割来防止识别率的下降。另外,由于在识别结果的识别分值为阈值以上的时刻结束处理,因此,能缩短识别处理所需的时间。现有技术文献专利文献专利文献1:日本专利特开2009-230068号公报
技术实现思路
专利技术所要解决的技术问题在专利文献I所代表的现有技术中,例如在通过语法型或听写型等不同的语音识别处理来依次进行识别的情况下,无法单纯比较识别结果各自的识别分值(匹配度)。因此,当识别分值在上述阈值以上的识别结果一个也没有时,存在以下问题:即,无法选择所获得的识别结果中识别分值最高的识别结果,从而无法对用户提示识别结果。本专利技术是为了解决上述那样的问题而完成的,其目的在于获得一种能正确提示由不同的语音识别处理所获得的识别结果、并能力图缩短识别处理时间的语音识别装置及包括该装置的导航装置。解决技术问题所采用的技术方案本专利技术所涉及的语音识别装置包括:获取部,该获取部对所输入的语音进行数字转换,并作为语音数据获取该数据;语音数据存储部,该语音数据存储部对获取部所获取的语音数据进行存储;多个语音识别部,该多个语音识别部从语音数据存储部所存储的语音数据中检测语音区间,提取出语音区间的语音数据的特征量,基于所提取出的特征量并参照识别词典来进行识别处理;切换部,该切换部对多个语音识别部进行切换;控制部,该控制部对切换部所进行的语音识别部的切换进行控制,以获取切换后的语音识别部的识别结果;以及选择部,该选择部从控制部所获取的识别结果中选择提示给用户的提示对象的识别结果。专利技术效果根据本专利技术,具有以下效果:即,能正确地提示由不同的语音识别处理所获得的识别结果,并能力图缩短识别处理时间。【附图说明】图1是表示包括本专利技术的实施方式I所涉及的语音识别装置的导航装置的结构的框图。图2是表示实施方式I所涉及的语音识别装置所进行的语音识别处理的流程的流程图。 图3是表示每个语音识别部的识别分值为上位至第2位的识别结果的显示例的图。图4是表示利用每个语音识别部各自不同的方法所选出的识别结果的显示例的图。图5是表示本专利技术的实施方式2所涉及的语音识别装置的结构的框图。图6是表示本专利技术的实施方式3所涉及的语音识别装置的结构的框图。图7是表示实施方式3所涉及的语音识别装置所进行的语音识别处理的流程的流程图。图8是表示本专利技术的实施方式4所涉及的语音识别装置的结构的框图。图9是表示实施方式4所涉及的语音识别装置所进行的语音识别处理的流程的流程图。图10是表示本专利技术的实施方式5所涉及的语音识别装置的结构的框图。图11是表示实施方式5所涉及的语音识别装置所进行的语音识别处理的流程的流程图。【具体实施方式】下面,为了对本专利技术进行更加详细的说明,参照附图对本专利技术的实施方式进行说明。实施方式1.图1是表示包括本专利技术的实施方式I所涉及的语音识别装置的导航装置的结构的框图。在图1中,示出了实施方式I所涉及的导航装置将实施方式I所涉及的语音识别装置应用于搭载在作为移动体的车辆上的车载用导航装置的情况。作为语音识别装置的结构,其包括:语音获取部1、语音数据存储部2、语音识别部3、语音识别切换部4、识别控制部5、识别结果选择部6以及识别结果存储部7,作为进行导航的结构,包括:显示部8、导航处理部9、位置检测部10、地图数据库(DB) 11以及输入部12。语音获取部I是对利用麦克风等输入的规定期间的语音进行模数转换、并作为例如PCM (Pulse Code Modulation:脉冲编码调制)格式的语音数据来获取该数据的获取部。语音数据存储部2是对由语音获取部I所获取的语音数据进行存储的存储部。语音识别部3由例如进行语法型或听写型等不同的语音识别处理的多个语音识别部(以下记载为第一?第M语音识别部)所构成。第一?第M语音识别部根据各语音识别算法,从语音获取部I所获取的语音数据中检测出属于用户说话内容的语音区间,提取出该语音区间中的语音数据的特征量,基于所提取出的特征量,一边参照识别词典,一边进行识别处理。语音识别切换部4是根据来自识别控制部5的切换控制信号来对第一?第M语音识别部进行切换的切换部。识别控制部5是对语音识别切换部4所进行的语音识别部的切换进行控制、以获取切换后的语音识别部的识别结果的控制部。识别结果选择部6是从识别控制部5所获取的识别结果中选出要输出的识别结果的选择部。识别结果存储部7是对识别结果选择部6所选择的识别结果进行存储的存储部。显示部8是显示存储于识别结果存储部7的识别结果或导航处理部9的处理结果的显示部。导航处理部9是进行路线计算、路线引导及地图显示等导航处理的功能结构部。例如,导航处理部9利用位置检测部10所获取的本车的当前位置、实施方式I所涉及的语音识别装置或输入部12所输入的目的地以及地图数据库(DB) 11所存储的地图数据,来计算从当前的本车位置到目的地的路线。然后,导航处理部9对通过路线计算获得的路线进行指引引导。另外,导航处理部9利用本车的当前位置及地图DBll所存储的地图数据,将包含本车位置的地图显示于显示部8。位置检测部10是根据GPS (Global Positioning System:全球定位系统)电波等的分析结果来获取本车的位置信息(纬度经度)的功能结构部。另外,地图DBll是登录有导航处理部9所使用的地图数据的数据库。地图数据中包括地形图数据、住宅地图数据及道路网络等。输入部12是接受用户所进行的目的地的设定输入或各种操作的功能结构部,例如由搭载在显示部8的画面上的触摸面板等来实现。下面,对动作进行说明。图2是表示实施方式I所涉及的语音识别装置所进行的语音识别处理的流程的流程图。首先,语音获取部I对利用麦克风等所输入的规定期间的语音进行Α/D转换,并作为例如PCM格式的语音数据来获取该数据(步骤ST10)。语音数据存储部2对语音获取部I所获取的语音数据进行存储(步骤ST20)。接着,识别控制部5将变量N初始化为I (步骤ST30)。其中,N是可取I?M的值的变量。然后,识别控制部5向语音识别切换部4输出将语音识别部3切换成第N语音识别部的切换控制信号。语音识别切换部4根据来自识别控制部5的该切换控制信号,将语音识别部3切换成第N语音识别部(步骤ST40)。第N语音识别部从语音数据存储部2所存储的语音数据中检测出属于用户说话内容的语音区间,提取出该语音区间中的语音数据的特征量,基于该特征量,一边参照识别词典,一边进行识别处理(步骤ST50 )。识别控制本文档来自技高网...

【技术保护点】
一种语音识别装置,其特征在于,包括:获取部,该获取部对所输入的语音进行数字转换,并作为语音数据来获取该数据;语音数据存储部,该语音数据存储部对所述获取部所获取的语音数据进行存储;多个语音识别部,该多个语音识别部从所述语音数据存储部所存储的语音数据中检测语音区间,提取出所述语音区间的语音数据的特征量,基于所提取出的所述特征量并参照识别词典来进行识别处理;切换部,该切换部对所述多个语音识别部进行切换;控制部,该控制部对所述切换部所进行的语音识别部的切换进行控制,以获取切换后的语音识别部的识别结果;以及选择部,该选择部从所述控制部所获取的识别结果中选择提示给用户的提示对象的识别结果。

【技术特征摘要】
【国外来华专利技术】1.一种语音识别装置,其特征在于,包括: 获取部,该获取部对所输入的语音进行数字转换,并作为语音数据来获取该数据; 语音数据存储部,该语音数据存储部对所述获取部所获取的语音数据进行存储; 多个语音识别部,该多个语音识别部从所述语音数据存储部所存储的语音数据中检测语音区间,提取出所述语音区间的语音数据的特征量,基于所提取出的所述特征量并参照识别词典来进行识别处理; 切换部,该切换部对所述多个语音识别部进行切换; 控制部,该控制部对所述切换部所进行的语音识别部的切换进行控制,以获取切换后的语音识别部的识别结果;以及 选择部,该选择部从所述控制部所获取的识别结果中选择提示给用户的提示对象的识别结果。2.一种语音识别装置,其特征在于,包括: 获取部,该获取部对所输入的语音进行数字转换,并作为语音数据来获取该数据; 语音区间检测部,该语音区间检测部从所述获取部所获取的语音数据中检测出属于用户说话内容的语音区间; 语音数据存储部,该语音数据存储部对所述语音区间检测部所检测到的每个语音区间的语音数据进行存储; 多个语音识别部,该多个语音识别部提取出所述语音数据存储部所存储的语音数据的特征量,基于所提取出的所述特征量并参照识别词典来进行识别处理; 切换部,该切换部对所述多个语音识别部进行切换; 控制部,该控制部对所述切换部所进行的语音识别部的切换进行控制,以获取切换后的语音识别部的识别结果;以及 选择部,该选择部从所述控制部所获取的识别结果中选择提示给用户的提示对象的识别结果...

【专利技术属性】
技术研发人员:石井纯山崎道弘
申请(专利权)人:三菱电机株式会社
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利