语音识别装置制造方法及图纸

技术编号:11174966 阅读:69 留言:0更新日期:2015-03-20 04:04
根据本发明专利技术的语音识别装置,对于由语音识别部从用户的语音内容中提取出的关键字,将根据用户的操作来进行显示的内容和次数作为历史信息进行存储,通过判定是否进行了规定次数以上的相同操作以及显示来设定检索等级,由此能够在下一次提取出相同的关键字时,立即提示出用户所要求的等级的信息,能够始终高效地提供用户所需的详细信息,从而提高了用户的便利性。

【技术实现步骤摘要】
【国外来华专利技术】语音识别装置
本专利技术涉及对用户所说出的语音进行识别并检索信息的语音识别装置。
技术介绍
在搭载于车载导航系统等的语音识别功能中,通常搭乘者(用户)会向系统明确表示(指示)发话的开始。为此,会在触摸面板上显示、或在方向盘上设置指示语音识别开始的按钮(以下记为“语音识别开始指示部”)。接着,在语音识别开始指示部被搭乘者(用户)按下之后,对所说出的语音进行识别。即,语音识别开始指示部输出语音识别开始信号,若语音识别部接受该信号,则在接受该信号之后从由语音获取部获取的音频数据中检测出与搭乘者(用户)所说的内容相应的音频区间,由此来进行语音识别处理。然而,也存在即使没有来自搭乘者(用户)的语音识别开始指示,也始终对搭乘者(用户)所说的内容进行识别的语音识别装置。即,语音识别部即使没有接受语音识别开始信号,也反复进行以下处理,即:从语音获取部所获取的音频数据中检测出与搭乘者(用户)所说的内容相应的音频区间,提取出该音频区间的音频数据的特征量,并基于该特征量使用识别词典来进行识别处理,从而输出语音识别结果的字符串。或者,基于该字符串来检索数据库,并显示检索结果。例如在专利文献1中,公开了下述语音识别装置,在该语音识别装置中,始终输入用户所说出的语音来进行语音识别,并显示该识别结果,然后用户利用操作按钮来进行确定操作,由此执行基于识别结果的处理。现有技术文献专利文献专利文献1:日本专利特开2008-14818号公报
技术实现思路
专利技术所要解决的技术问题然而,在例如专利文献1这样的现有语音识别装置中,存在以下问题,即:在识别出相同语音的情况下,始终仅显示同一等级的检索结果。即存在下述问题:例如,当用户说出“加油站”时,始终仅显示附近的加油站的站名和位置,用户为了获知每个加油站的价格,每次都必须另外进行规定的操作。本专利技术是为了解决上述问题而完成的,其目的在于提供一种语音识别装置,该语音识别装置能够立即示出用户所要求的等级的信息。解决技术问题所采用的技术方案为实现上述目的,本专利技术的语音识别装置的特征在于,包括:语音获取部,该语音获取部检测并获取用户所说出的语音;语音识别部,该语音识别部对由所述语音获取部获取到的音频数据进行识别,并提取出关键字;操作输入部,该操作输入部接受来自所述用户的操作输入;显示部,该显示部向所述用户提示信息;操作应答解析部,该操作应答解析部基于由所述操作输入部接受到的信息和所述显示部所显示的信息,确定所述用户的操作;操作显示历史存储部,该操作显示历史存储部对于由所述语音识别部提取出的每个关键字,将根据由所述操作应答解析部所确定的操作而显示在所述显示部的显示内容及其显示次数作为历史信息进行存储;检索等级设定部,该检索等级设定部根据所述操作显示历史存储部所存储的历史信息,设定由所述语音识别部提取出的关键字的检索等级;信息检索控制部,该信息检索控制部根据由所述检索等级设定部所设定的检索等级,将由所述语音识别部提取出的关键字作为检索关键词来检索信息,并获得检索结果;以及信息提示控制部,该信息提示控制部指示所述显示部显示由所述信息检索控制部所获取的检索结果,所述检索等级设定部对于由所述语音识别部提取出的关键字,当所述操作显示历史存储部所存储的历史信息中的显示次数为规定次数以上时,改变所述检索等级。专利技术效果根据本专利技术的语音识别装置,能够立即提示用户所要求的等级的信息,能够始终高效地提供用户所需的详细信息,从而提高了用户的便利性。附图说明图1是表示导航装置的显示画面例的图。图2是表示实施方式1的语音识别装置的一个示例的框图。图3是表示检索等级的定义例的图。图4是表示信息检索控制部所设定的每个关键字的检索等级的示例的图。图5是表示操作显示历史存储部所存储的每个关键字的用户操作历史和显示历史的图。图6是表示实施方式1的语音识别装置的动作的流程图。图7是表示关于操作显示历史存储部所存储的一个关键字(加油站)的操作历史和显示历史被更新的示例的图。图8是表示检索结果的显示例的图。图9是表示实施方式2的语音识别装置的一个示例的框图。图10是表示实施方式2的语音识别装置的动作的流程图。图11是表示实施方式3的语音识别装置的一个示例的框图。图12是表示实施方式3的语音识别装置的动作的流程图。图13是表示实施方式4的语音识别装置的一个示例的框图。图14是表示实施方式4的语音识别装置的动作的流程图。具体实施方式下面,参照附图对本专利技术的实施方式进行详细说明。首先,对作为本专利技术的前提的组装有语音识别装置的导航装置进行说明。图1是表示一般的导航装置的显示画面例的图。例如,在搭载有该导航装置的车内,在导航装置的画面70中显示有用于通常的道路引导的地图和本车标记71的状态下,进行下述对话。用户A:“汽油快用完啦”用户B:“附近不知道有没有加油站啊”于是,对应于该语音内容中所包含的种类名(本例中为“加油站”)的种类名图标72显示在导航装置的画面70中(图1(a))。若用户按下该图标72,则检索当前位置附近的加油站,并将加油站的例如名称和地址等作为检索结果以检索结果列表73的方式进行显示(图1(b))。接着,若用户选择所显示的检索结果中的一个,则以设施标记74的方式显示所选择的加油站的位置信息,并且显示详情按钮75(例如“营业时间”按钮75a和“价格”按钮75b),从而显示该加油站的详细信息,例如营业时间、汽油价格等(图1(c))。此处,若用户按下“营业时间”的按钮75a,则显示该加油站的营业时间(图1(d))。在以下的实施方式中,均以基于上述加油站这一种类的设施检索为例来进行说明,但本专利技术中进行检索的信息并不限于这种设施信息,也可以是交通信息、天气信息、地址信息、新闻、音乐信息、电影信息、节目信息等。实施方式1.图2是表示本专利技术的实施方式1的语音识别装置的一个示例的框图。该语音识别装置组装在搭载于车辆(移动体)的导航装置中进行使用,其包括:语音获取部1、语音识别部2、语音识别词典3、信息数据库4、信息检索控制部5、信息提示控制部6、显示部7、操作输入部8、操作应答解析部9、操作显示历史存储部10、以及检索等级设定部11。语音获取部1获取由麦克风收集的用户语音即输入的音频,并利用PCM(PulseCodeModulation:脉冲编码调制)进行A/D(Analog/Digital:模拟/数字)转换。语音识别部2从经过语音获取部1进行了数字化后的音频信号中检测出与用户所说的内容相应的音频区间,提取出该音频区间的音频数据的特征量,基于该特征量使用语音识别词典3进行识别处理,从而输出语音识别结果的字符串。另外,作为识别处理,使用例如HMM(HiddenMarkovModel:隐式马尔克夫模型)法这样的一般方法来进行即可。在搭载于车载导航系统等的语音识别功能中,通常搭乘者(用户)会向系统明确表示(指示)发话的开始。因此,会在触摸面板上显示、或在方向盘上设置指示语音识别开始的按钮(以下记为语音识别开始指示部)。于是,在语音识别开始指示部被用户按下之后,对所说出的语音进行识别。即,语音识别开始指示部输出语音识别开始信号,若语音识别部接受该信号,则在接受该信号之后从由语音获取部获取的音频数据中检测出与用户所说的内容相应的音频区间,由此来进行上述识别处理本文档来自技高网...
语音识别装置

【技术保护点】
一种语音识别装置,其特征在于,包括:语音获取部,该语音获取部检测并获取用户所说出的语音;语音识别部,该语音识别部对由所述语音获取部获取到的音频数据进行识别,并提取出关键字;操作输入部,该操作输入部接受来自所述用户的操作输入;显示部,该显示部向所述用户提示信息;操作应答解析部,该操作应答解析部基于由所述操作输入部接受到的信息和所述显示部所显示的信息,确定所述用户的操作;操作显示历史存储部,该操作显示历史存储部对于由所述语音识别部提取出的每个关键字,将根据由所述操作应答解析部确定的操作而显示在所述显示部的显示内容及其显示次数作为历史信息进行存储;检索等级设定部,该检索等级设定部根据所述操作显示历史存储部所存储的历史信息,设定由所述语音识别部提取出的关键字的检索等级;信息检索控制部,该信息检索控制部根据由所述检索等级设定部所设定的检索等级,将由所述语音识别部提取出的关键字作为检索关键词来检索信息,从而获得检索结果;以及信息提示控制部,该信息提示控制部指示所述显示部显示由所述信息检索控制部所获取的检索结果,所述检索等级设定部对于由所述语音识别部提取出的关键字,在所述操作显示历史存储部所存储的历史信息中的显示次数为规定次数以上时,改变所述检索等级。...

【技术特征摘要】
【国外来华专利技术】1.一种语音识别装置,其特征在于,包括:语音获取部,该语音获取部检测并获取用户所说出的语音;语音识别部,该语音识别部对由所述语音获取部获取到的音频数据进行识别,并提取出关键字;操作输入部,该操作输入部接受来自所述用户的操作输入;显示部,该显示部向所述用户提示信息;操作应答解析部,该操作应答解析部基于由所述操作输入部接受到的信息和所述显示部所显示的信息,确定所述用户的操作;操作显示历史存储部,该操作显示历史存储部对于由所述语音识别部提取出的每个关键字,将根据由所述操作应答解析部确定的操作而显示在所述显示部的显示内容及其显示次数作为历史信息进行存储;检索等级设定部,该检索等级设定部根据所述操作显示历史存储部所存储的历史信息,设定由所述语音识别部提取出的关键字的检索等级;信息检索控制部,该信息检索控制部根据由所述检索等级设定部所设定的检索等级,将由所述语音识别部提取出的关键字作为检索关键词来检索信息,从而获得检索结果;以及信息提示控制部,该信息提示控制部指示所述显示部显示由所述信息检索控制部所获取的检索结果,所述显示部根据来自所述信息提示控制部的指示来显示检索结果,所述检索等级设定部对于由所述语音识别部提取出的关键字,在所述操作显示历史存储部所存储的历史信息中的显示次数为规定次数以上时,改...

【专利技术属性】
技术研发人员:丸田裕三
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1