语音识别装置制造方法及图纸

技术编号:11677115 阅读:180 留言:0更新日期:2015-07-06 03:46
根据本发明专利技术的语音识别装置,即使是在始终对说出的语音进行识别的情况下,也能够接受语音识别开始指示的操作,因此能够避免因每次识别都需要进行特定操作所带来的麻烦,而且在说话人希望的情况下,能够通过语音识别开始指示的操作,利用识别率更高的语音识别方法来进行识别,从而能够提高便利性。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及对说出的语音进行识别的语音识别装置
技术介绍
作为语音识别的方法,在说话人进行了语音识别开始指示的操作之后对说出的语音进行识别的方法、和不进行该操作而始终对说出的语音进行识别的方法已广为人知。前一方法通过明确地示出所说语音的起始端,从而使区间检测变得容易,因此识别率变高,但由于在识别时需要进行特定的操作,因此比较麻烦。而后一方法无需进行特定的操作,因此克服了上述缺点,但由于语音的区间检测较为困难,所以存在识别率变低的问题。为解决这些问题,例如专利文献I中公开了具备上述2种语音识别方法并根据说话人的状况或周围的状况来自动地切换到合适的语音识别方法的语音识别装置。具体而言,例如在周围的噪音较大的情况下切换到前一语音识别方法,在噪音较小的情况下切换到后一语音识别方法。 现有技术文献专利文献专利文献I 日本专利特开2001-42894号公报
技术实现思路
专利技术所要解决的技术问题然而,在例如专利文献I那样的现有语音识别装置中,当切换到其中一个语音识别方法时,就无法使用另一语音识别方法。因此,例如即使在噪音较小的场所想要更可靠地对语音进行识别的情况下,也无法使用前一语音识别方法,从而存在对于说话人来说便利性较低的问题。本专利技术是为了解决上述技术问题而完成的,其目的在于提供一种即使是在始终对说出的语音进行识别的情况下也能够接受说话人的语音识别开始指示操作的语音识别装置。 解决技术问题所采用的技术手段为了达到上述目的,本专利技术的语音识别装置对说出的语音进行识别,其包括:语音获取部,该语音获取部检测并获取所述说出的语音;第I语音识别部,该第I语音识别部在所述语音识别装置启动的情况下始终对所述语音获取部所获取的语音数据进行识别;语音识别开始指示部,该语音识别开始指示部输出语音识别开始的指示信号;第2语音识别部,该第2语音识别部在接收到所述语音识别开始指示部输出的信号时,对所述语音获取部所获取的语音数据进行识别;以及控制部,该控制部获取并输出所述第I语音识别部或所述第2语音识别部的识别结果,所述控制部获取所述第I语音识别部的识别结果,在没有接收到所述语音识别开始指示部输出的信号的情况下,将所述第I语音识别部的识别结果输出到所述语音识别装置所适用的装置,在接收到所述语音识别开始指示部输出的信号的情况下,获取所述第2语音识别部的识别结果,并将该第2语音识别部的识别结果优先于所述第I语音识别部的识别结果进行输出。 专利技术效果根据本专利技术的语音识别装置,即使是在始终对说出的语音进行识别的情况下,也能够接受语音识别开始指示的操作,因此能够避免因识别时需要进行特定操作所带来的麻烦,而且在说话人希望的情况下,能够通过语音识别开始指示的操作,利用识别率更高的语音识别方法来进行识别,从而能够提高便利性。【附图说明】图1是表示实施方式I的语音识别装置的一个示例的框图。 图2是表示实施方式I的语音识别装置中的处理的流程图。 图3是表示实施方式2的语音识别装置的一个示例的框图。 图4是存储了画面的类别信息的表格。 图5是表示实施方式2的语音识别装置中的处理的流程图。 图6是表示在导航部的显示部上显示名称列表的画面例的图。 图7是表示实施方式3的语音识别装置的一个示例的框图。 图8是表示实施方式3的语音识别装置中的处理的流程图。 图9是表示实施方式4的语音识别装置的一个示例的框图。 图10是表示实施方式4的语音识别装置中的处理的流程图。 图11是明确示出是否是输出始终进行语音识别的第I语音识别部的识别结果的状态的图像或文字等的例子。 图12是在一般的导航画面中显示图11所示的图像或文字等的例子。 图13是在一般的导航画面中用视觉性的方法显示噪音音量的例子。【具体实施方式】下面,参照附图,对本专利技术的实施方式进行详细说明。 本专利技术是对说出的语音进行识别的语音识别装置,在该语音识别装置启动的情况下,始终进行语音识别,同时也接受说话人的语音识别开始指示的操作。在下面的实施方式中,以将本专利技术的语音识别装置用于搭载于车辆等移动体的导航装置的情况为例进行说明,但也可以用于安装在智能手机、平板电脑、移动电话等上的导航系统等。实施方式I 图1是表示本专利技术的实施方式I的语音识别装置的一个示例的框图。该语音识别装置10包括语音获取部1、语音识别开始指示部2、语音识别部3、语音识别词典4和控制部5。该语音识别装置10被用于具备导航部6的导航装置。语音获取部I取得由麦克风收集的话语、即输入的语音,并通过例如PCM(PulseCode Moduat1n:脉冲编码调制)来进行A/D (Analog/Digital:模/数)转换。语音识别开始指示部2是例如显示在触摸屏上的图标、手柄或设置在导航系统中的按钮或遥控器等的操作部,当说话人按下该语音识别开始指示部2时,向后述的第2语音识别部3b输出指示语音识别处理开始的信号。还向后述的控制部5输出表示语音识别开始指示部2被按下的信号。语音识别部3由第I语音识别部3a和第2语音识别部3b构成,从经由语音获取部I而数字化后的语音信号中,检测出与说话内容相符合的语音区间,提取出该语音区间的语音数据的特征量,基于该特征量,利用语音识别词典4进行识别处理,并输出语音识别结果的字符串。识别处理使用例如HMM(Hidden Markov Model:隐马尔可夫模型)法之类的一般方法即可。这里,第I语音识别部3a在说话人没有做出语音识别开始指示的情况下也始终对说话人说话的内容进行识别。即,第I语音识别部3a在没有接收到语音识别开始指示部2输出的语音识别开始指示信号的情况下,也始终对语音获取部I所获取的语音数据进行上述识别处理。另一方面,第2语音识别部3b在说话人按下语音识别开始指示部2从而接收到语音识别开始指示部2所输出的语音识别开始信号时,以此为触发来对语音获取部I所获取的语音数据进行识别。该第I语音识别部3a的识别结果与第2语音识别部3b的识别结果相比,始终进行识别的第I语音识别部3a的识别结果的精度没有第2语音识别部3b的识别结果的精度好。但由于在说话人没有作出语音识别开始指示的情况下也始终进行语音识别,因此便利性更好。 另一方面,第2语音识别部3b的识别结果是以说话人做出的语音识别开始指示为触发来开始语音识别的,因此语音识别开始地点明确,所以语音识别的精度更好。但说话人必须要在语音识别开始指示部2上进行操作。语音识别词典4中存储有用来在语音识别部3 (第I语音识别部3a和第2语音识别部3b)进行语音识别时与语音数据的特征量进行对照的可能被提取出的词汇。控制部5获取语音识别部3 (第I语音识别部3a和第2语音识别部3b)所识别的结果,判断是否输出各识别结果,并将其输出至后述的导航部6 (语音识别装置10所适用的装置)。此时,控制部5基本上是输出第I语音识别部3a所识别出的识别结果字符串,但在语音识别开始指示部2输出了信号的情况下,将第2语音识别部3b所识别的识别结果字符串优先于第I语音识别部3a所识别的识别结果字符串进行输出。导航部6使用控制部5所输出的识别结果字符串来进行设施检索、或将识别结果显示在画面上、或执行与识别结果字符串相对应的功能。导航部6具备通常的导航装置所具备的本文档来自技高网...
语音识别装置

【技术保护点】
一种语音识别装置,对说出的语音进行识别,其特征在于,包括:语音获取部,该语音获取部检测并获取所述说出的语音;第1语音识别部,该第1语音识别部在所述语音识别装置启动的情况下始终对所述语音获取部所获取的语音数据进行识别;语音识别开始指示部,该语音识别开始指示部输出语音识别开始的指示信号;第2语音识别部,该第2语音识别部在接收到所述语音识别开始指示部输出的信号时,对所述语音获取部所获取的语音数据进行识别;以及控制部,该控制部获取并输出所述第1语音识别部或所述第2语音识别部的识别结果,所述控制部获取所述第1语音识别部的识别结果,在没有接收到所述语音识别开始指示部输出的信号的情况下,将所述第1语音识别部的识别结果输出到所述语音识别装置所适用的装置,在接收到所述语音识别开始指示部输出的信号的情况下,获取所述第2语音识别部的识别结果,并将该第2语音识别部的识别结果优先于所述第1语音识别部的识别结果进行输出。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:古本友纪
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1