语音识别系统技术方案

技术编号:16111740 阅读:19 留言:0更新日期:2017-08-30 05:08
语音识别系统(2)包括:在整个预先设定的语音获取期间获取用户发话的语音的语音获取部(10);对语音获取部(10)获取到的语音进行识别的语音识别部(11);判定用户是否进行了预定的操作或动作的判定部(14);以及在判定部(14)中判定为用户进行了预定的操作或动作的情况下使显示部(18)显示使导航系统(1)执行与语音识别部(11)的识别结果相对应的功能的功能执行按钮的显示控制部(15)。

【技术实现步骤摘要】
【国外来华专利技术】语音识别系统
本专利技术涉及对用户的发话进行识别的语音识别系统。
技术介绍
现有的语音识别系统中,用户预先考虑想让系统识别的内容,需要在通过按下PTT(PushToTalk:按键通话)按钮等而进行了语音识别开始指示后进行发话。该系统中,无法自动识别用户彼此的自然会话中出现的单词,因此为了识别该单词,用户不得不在按下了PTT按钮等后再次发话。因此,具有操作繁琐的问题及会遗忘想要识别的内容的问题。与此相对,存在始终对由麦克风收集到的语音进行语音识别的语音识别系统。该语音识别系统中,无需由用户进行语音识别开始指示,因此,能消除上述繁琐性。然而,无论用户是否存在操作意图均随意地执行与识别结果相对应的功能,因此会使用户混乱。此处,专利文献1记载有如下动作控制装置:该动作控制装置始终识别语音,生成并显示用于执行与识别结果相对应的功能的快捷键。现有技术文献专利文献专利文献1:日本专利特开2008-14818号公报
技术实现思路
专利技术所要解决的技术问题上述专利文献1的动作控制装置中,只有在用户按下了快捷键后,才执行与识别结果相对应的功能,因此能防止违背用户意图而随意进行动作的情况。然而,专利文献1的情况下,显示于画面的信息的一部分被快捷键所隐藏,因显示快捷键时的画面更新而产生显示内容的变化,因此具有如下问题:会使用户产生不快感,或者在驾驶中等情况下,会产生集中力的降低。本专利技术是为了解决上述问题而完成的,其目的在于提供一种语音识别系统,该语音识别系统始终识别语音,并能在用户需要的时刻呈现用于执行与识别结果相对应的功能的功能执行按钮。解决技术问题的技术方案本专利技术所涉及的语音识别系统包括:语音获取部,该语音获取部在整个预先设定的语音获取期间获取用户发话的语音;语音识别部,该语音识别部对语音获取部获取到的语音进行识别;判定部,该判定部对用户是否进行了预定的操作或动作进行判定;以及显示控制部,该显示控制部在判定部中判定为用户进行了预定的操作或动作的情况下使显示部显示功能执行按钮,所述功能执行按钮使被控制装置执行与语音识别部的识别结果相对应的功能。专利技术效果本专利技术在预先设定的整个语音获取期间取得语音,并在用户进行了预定的操作或动作时,显示基于发话内容的功能执行按钮,因此能消除在按下PTT按钮后将在会话中已出现的词汇再次重新发话的繁琐性。此外,不会产生违背用户的意图的动作,并且能抑制因功能执行按钮显示时的画面更新而导致的集中力的降低。并且,对于用户而言,呈现预测了自身的操作意图而获得的功能执行按钮,因此,能提高用户友好性及使用便利性。附图说明图1是表示应用了本专利技术的实施方式1所涉及的语音识别系统的导航系统的一个示例的框图。图2是表示应用了实施方式1所涉及的语音识别系统的导航系统的主要硬件结构的概要结构图。图3是用于说明实施方式1所涉及的语音识别系统的动作概要的说明图。图4是表示识别结果所包含的识别结果字符串与识别结果种类的示例的图。图5是表示识别结果种类与要分配给功能执行按钮的功能的对应的一个示例的图。图6是表示实施方式1所涉及的语音识别系统中的关于保持用户发话的识别结果的处理的流程图。图7是表示实施方式1所涉及的语音识别系统中的关于显示功能执行按钮的处理的流程图。图8是表示功能执行按钮的显示例的图。图9是表示识别结果储存部的识别结果的储存例的图。图10是表示功能执行按钮的显示形式的一个示例的图。图11是表示实施方式1所涉及的语音识别系统的变形例的框图。图12是表示用户的操作与识别结果种类的对应的一个示例的图。图13是表示本专利技术的实施方式2所涉及的语音识别系统中的关于显示功能执行按钮的处理的流程图。图14是表示功能执行按钮的其他显示例的图。图15是表示用户的发话内容与识别结果种类的对应及用户的动作内容与识别结果种类的对应的一个示例的图。图16是表示应用了本专利技术的实施方式3所涉及的语音识别系统的导航系统的一个示例的框图。图17是表示实施方式3所涉及的语音识别系统中的关于取得及保持用户发话的处理的流程图。图18是表示实施方式3所涉及的语音识别系统中的关于显示功能执行按钮的处理的流程图。具体实施方式下面,为了更详细地说明本专利技术,根据附图对用于实施本专利技术的方式进行说明。另外,以下的实施方式中,以将本专利技术所涉及的语音识别系统应用于车辆等移动体用的导航系统(被控制装置)的情况为例进行说明,但只要是有语音操作功能的系统,则可以应用于任何系统。实施方式1.图1是表示应用了本专利技术的实施方式1所涉及的语音识别系统2的导航系统1的一个示例的框图。该导航系统1包括:控制部3、输入接收部5、导航部6、语音控制部7、语音获取部10、语音识别部11、判定部14及显示控制部15。另外,导航系统1的构成要件可以分散于网络上的服务器、智能手机等移动终端、车载设备。此处,由语音获取部10、语音识别部11、判定部14及显示控制部15构成语音识别系统2。图2是表示实施方式1中的导航系统1与其周边设备的主要硬件结构的概要图。总线100连接有CPU(CentralProcessingUnit:中央处理单元)101、ROM(ReadOnlyMemory:只读存储器)102、RAM(RandomAccessMemory:随机存取存储器)103、HDD(HardDiskDrive:硬盘驱动器)104、输入装置105及输出装置106。CPU101通过读取存储于ROM102或HDD104的各种程序并执行,从而与各硬件相协作地实现作为导航系统1的控制部3、输入接收部5、导航部6、语音控制部7、语音获取部10、语音识别部11、判定部14及显示控制部15的功能。输入装置105是指示输入部4、输入接收部5及麦克风9。输出装置106是扬声器8及显示部18。首先,对语音识别系统2的动作概要进行说明。语音识别系统2在整个预先设定的语音获取期间连续取得由麦克风9收集到的语音,识别预定的关键词,并保持识别结果。然后,语音识别系统2判定移动体的用户是否对导航系统1进行了预定的操作,若进行了该操作,则生成用于利用所保持的识别结果来执行与识别结果相对应的功能的功能执行按钮,并将生成的功能执行按钮输出到显示部18。后文对预先设定的语音获取期间进行阐述。例如,在将图3(a)所示的地图显示画面显示于显示部18的显示器中时,用户A与用户B进行以下的会话。A:“这歌曲结束后接着播放什么?”B:“很久没听孩子小姐了,很想听”A:“好啊。话说中饭在餐厅吃好吗?”B:“便利店买点什么就好了”A:“了解”此处,语音识别系统2作为关键词对艺人名“孩子小姐”和设施种类名“餐厅”“便利店”进行识别,但该阶段并不在显示部18显示与上述识别结果相对应的功能执行按钮。另外,图3所示的“菜单”按钮HW1、“目的地”按钮HW2、“AV(AudioVisual:视听影音)”按钮HW3及“当前地”按钮HW4是设置于显示部18的显示器框体的硬件(HW)按键。之后,用户B为了检索当前地周边的便利店,按下用于显示菜单画面的“菜单”按钮HW1,在显示图3(b)所示的菜单画面时,语音识别系统2在显示部18中显示与识别结果“孩子小姐”“餐厅”“便利店”相对应的功能执行按钮即“孩子小姐”按钮SW1、“餐厅”按钮SW2及“便利店”按钮SW3。上述功能执行按钮本文档来自技高网...
语音识别系统

【技术保护点】
一种语音识别系统,其特征在于,包括:语音获取部,该语音获取部在整个预先设定的语音获取期间获取用户发话的语音;语音识别部,该语音识别部对所述语音获取部获取到的语音进行识别;判定部,该判定部对所述用户是否进行了预定的操作或动作进行判定;以及显示控制部,该显示控制部在所述判定部中判定为所述用户进行了预定的操作或动作的情况下,使显示部显示功能执行按钮,所述功能执行按钮使被控制装置执行与所述语音识别部的识别结果相对应的功能。

【技术特征摘要】
【国外来华专利技术】1.一种语音识别系统,其特征在于,包括:语音获取部,该语音获取部在整个预先设定的语音获取期间获取用户发话的语音;语音识别部,该语音识别部对所述语音获取部获取到的语音进行识别;判定部,该判定部对所述用户是否进行了预定的操作或动作进行判定;以及显示控制部,该显示控制部在所述判定部中判定为所述用户进行了预定的操作或动作的情况下,使显示部显示功能执行按钮,所述功能执行按钮使被控制装置执行与所述语音识别部的识别结果相对应的功能。2.如权利要求1所述的语音识别系统,其特征在于,所述判定部利用表示所述用户进行的操作或动作与所述语音识别部的识别结果的种类之间的对应关系的信息,来对与判定为所述用户进行了所述操作或所述动作的情况相对应的种类进行判定,所述显示控制部从所述语音识别部的识别结果中选择与所述...

【专利技术属性】
技术研发人员:住吉悠希武井匠马场直哉
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1