语音识别系统技术方案

技术编号:8191472 阅读:147 留言:0更新日期:2013-01-10 02:19
本发明专利技术公开了一种语音识别系统,该语音识别系统包括用于在语音识别中使用的识别字典和被配置成通过使用识别字典来识别输入语音的控制器。控制器基于输入语音的信号电平来检测语音段、通过使用识别字典来识别对应于语音段的语音数据并且显示识别处理的识别结果和列表形式的对应于识别结果的相应项目。以列表形式显示的相应项目能够手动操作。

【技术实现步骤摘要】

本公开涉及一种使得用户能够通过语音来至少部分地操作车载设备的语音识别系统
技术介绍
已知的语音识别系统将输入语音与预存储的比较候选进行比较,并且输出具有高的符合度的比较候选作为识别结果。近年来,提出了一种使得用户能够通过语音在不必用手操作的系统中输入电话号码的语音识别系统(参见对应于us 2007/0294086A的JP-2007-256643A)。此外,公开了一种用于通过有效地使用语音识别结果来方便用户操作 的方法(参见 JP-2008-14818A)。由于这些语音识别技术的采用可以减少按钮操作等,因此,驾驶车辆的驾驶员可以使用确保安全的语音识别。即,如果驾驶员他自己或她自己使用语音识别,则优点变得特别显著。在传统的语音识别系统中,在执行语音操作(也称作“语音命令控制”)的情况下,要求特定于语音操作的操作。例如,虽然某些系统可能允许基于按等级排列的列表显示的手动操作,但是,手动操作和语音操作通常是分离的。不同于手工操作,语音操作很难理解。
技术实现思路
鉴于前述内容做了本公开。本公开的目的是提供一种可以融合列表的手动操作和列表的语音操作并且改善可用性的语音识别系统。根据本公开的示例,语音识别系统包括用于在语音识别中使用的识别字典和被配置成通过使用识别字典来识别输入语音的控制器。控制器被配置成执行话音活动检测处理、识别处理和列表处理。在话音活动检测处理中,控制器基于输入语音的信号电平来检测语音段。在识别处理中,在在话音活动检测处理中检测到语音段的情况下,控制器通过使用识别字典来识别对应于语音段的语音数据。在列表处理中,控制器显示识别处理的识别结果和列表形式的对应于识别结果的相应项目。以列表形式显示的相应项目是能够手动操作的。根据以上配置,语音识别系统可以融合列表的手动操作和列表的语音操作,并且可以改善可用性。附图说明根据参考附图给出的以下详细描述,本公开的以上和其他目的、特征和优点将变得更加明白。在附图中图I是示出语音识别系统的框图;图2是示出语音识别处理的流程图;图3是示出语音信号的图4是示出列表显示处理的流程图;图5是示出手动操作处理的流程图;图6A至6F是每个示出列表显示的图;以及图7是示出列表显示中的可操作图标的图。具体实施例方式下面将描述实施例。图I是示出一个实施例的语音识别系统I的框图。语音识别系统I被安装至车辆并且包括整体控制语音识别系统I的控制器10。控制器10包括具有中央处理单元(CPU)、只读存储器(ROM)、随机存取存储器(RAM)、输入/输出(I/O)和连接上述部件的总线线路的计算机。·控制器10与语音识别单元20、一组操作开关30和显示单元40连接。语音识别单元20包括语音输入装置21、语音存储装置22、语音识别装置23和显示确定装置24。语音输入装置21被设置成输入语音,并且与麦克风50连接。将输入到语音输入装置21并且被语音输入装置21切割的语音作为语音数据存储在语音存储装置22中。语音识别装置23执行对存储在语音存储装置22中的语音数据的识别。具体地,通过参考识别字典25,语音识别装置23将语音数据与预存储的比较候选进行比较,从而根据比较候选获得识别结果。识别字典25可以是存储比较候选的专用字典。在本实施例中,没有对比较候选进行分组等。将语音数据与存储在识别字典中的所有比较候选进行比较。基于通过语音识别装置23获得的识别结果,显示确定装置24确定对应于识别结果的相应项目。准备对应于识别结果的相应项目,作为相应项目列表26。可以根据相应项目列表26来识别对应于每个识别结果的相应项目。用户能够手动操作一组操作开关30。显示单元40可以包括例如液晶显示器。显示单元40向用户提供信息。将描述本实施例的语音识别处理。由控制器10来执行语音识别处理。响应于通过一组操作开关30进行的预定操作,控制器10执行语音识别处理。首先,在SlOO处,控制器10显示初始画面。在该步骤中,在显示单元40上显示初始列表显示。具体地,如图6A所示,在画面的上部显示显示“听”,并且此外,在显示“听”下面显示语音识别候选中的一部分语音识别候选。在图6A中,显示了四个项目“空气调节器”、“音乐”、“电话”和“搜索周边”。在SllO处,控制器10执行手动操作处理。在本实施例中,可以并行执行语音操作和手动操作。在语音识别处理期间,重复执行手动操作处理。稍后将描述手动操作处理的细节。在S120处,控制器10确定是否出现了语音段。具体地,控制器10确定电平大于或等于阈值的信号是否经由麦克风50被输入到语音输入装置21。如果控制器10确定出现了语音段,对应于在S120处为是,则处理继续进行至S130。如果控制器10确定没有出现语音段,对应于在S120处为否,则处理返回S110。如果检测到语音段,则在S130处,控制器10获取语音。具体地,输入到语音输入装置21的语音被获取,并且被放到缓存等中。在S140处,控制器10确定是否检测到第一非语音段(也称为第一无语音段)。在本实施例中,将其间经由麦克风50输入到语音输入装置21的信号的电平低于阈值的区段定义为非语音段。非语音段包括例如由于车辆的行进而导致的噪音。在S140处,如果非语音段持续预定时间Tl,则该非语音段被确定为第一非语音段。如果控制器10确定检测到了第一非语音段,对应于在S140处为是,则处理继续进行至S150。在S150处,控制器10将在S130处获得的语音作为语音数据记录在语音存储装置22中。如果控制器10确定没有检测到第一非语音段,对应于在S140处为否,则处理返回S130以重复S130和随后的步骤。在以上步骤中,如果语音段在进行中,或者还没有持续预定时间Tl的非语音段在进行中,则控制器10确定没有检测到第一非语音段。在S150之后,处理继续进行至S160。在S160处,控制器10确定是否检测到第二非语音段(也称为第二无语音段)。在本实施例中,持续第二预定时间T2的非语音段被确定为第二非语音段。如果控制器10确定检测到了第二非语音段,对应于在S160处为是,则处理继续进行至S170。如果控制器10确定没有检测到第二非语音段,对应于在S160处为否,则处理返回SllO以重复SllO和随后的步骤。 现在,给出关于存储语音数据的说明。图3是示意性地示出经由麦克风50输入的语音的信号的图。在时间tl处,使用一组操作开关30来指示语音操作的开始。在图3所示的示例中,从时间t2到时间t3的区段被确定为语音段A(在S120处为是)。只要确定没有检测到第一非语音段Tl (在S140处为否),则获取语音(S130)。如果确定检测到了第一非语音段Tl(在S140处为是),则记录对应于语音段A的语音数据(S150)。此后,只要确定没有检测到第二非语音段T2 (在S160处为否),则重复SllO和随后的步骤。在图3所示的示例中,从时间t4到时间t5的区段被确定为语音段B (在S120处为是),并且记录对应于语音段B的语音数据(S150)。此后,如果确定检测到第二非语音段T2 (在S160处为是),则执行识别处理(S170)。因此,在图3所示的示例中,对应于语音段A和语音段B两个语音段的语音数据是识别处理的对象。在本实施例中,可以将多个语音数据作为识别处理的对象。描本文档来自技高网...

【技术保护点】
一种语音识别系统,包括:识别字典(25),所述识别字典(25)用于在语音识别中使用;以及控制器(10),所述控制器(10)被配置成通过使用所述识别字典(25)来识别输入语音,其中,所述控制器(10)被配置成执行:话音活动检测处理,用于基于所述输入语音的信号电平来检测语音段,识别处理,用于在在所述话音活动检测处理中检测到所述语音段的情况下通过使用所述识别字典(25)来识别对应于所述语音段的语音数据,以及列表处理,用于显示:所述识别处理的识别结果以及列表形式的对应于所述识别结果的相应项目,其中,以列表形式显示的所述相应项目能够手动操作。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:藤泽友纪浅见克志
申请(专利权)人:株式会社电装
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利