声音识别装置制造方法及图纸

技术编号:5491377 阅读:129 留言:0更新日期:2012-04-11 18:40
一种声音识别装置,包括将作为检索对象的词汇按照类别进行存储的类别数据库(DB),用于车载设备用,包括:将发出的声音作为发声数据输出的麦克(1);用于识别在类别(DB)中作为检索对象的类别的词汇的第一声音识别词典(2a);用于识别作为检索对象以外的类别的词汇的第二声音识别词典(2b);通过将从麦克传送来的发声数据与第一及第二声音识别词典所包含的词汇对照,识别发出的声音的声音识别部(3);在从声音识别部传送来的作为识别结果的词语是通过使用第二声音识别词典而得到的词语时,将表示该事实的消息作为呈现信息输出的对话控制部(4);以及将该呈现信息向外部呈现的呈现部(5)。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及识别发出的声音的声音识别装置,特别是涉及减少伴随着声音 的误识别而产生的问题的技术。
技术介绍
以往,已知一种可以利用声音识别来发出各种指令的车载导航装置。在没 有利用声音识别的车载导航装置中,通过从列表显示的菜单进行选择操作来指 定类别,与之相对,在利用声音识别的车载导航装置中,即使在行驶中等无法 看到列表显示的状态下,例如通过发出类别名称等的声音,也可以指定类别。由于这样的声音识别是一种只能识别被预先录入声音识别词典中的词汇 的技术,所以在通过声音识别进行输入时,用户需要准确发出表示类别的词语 的声音。然而,由于在车载导航装置中作为检索对象的类别的数量一般而言有 几十种以上,所以用户难以记住车载导航装置中可以利用的类别。另夕卜,将车 载导航装置中可以利用的类别与城市主页或互联网等用户在日常生活中看到 的类别或其他车载导航装置可利用的类别区别开也是十分困难的。另外,作为相关的技术,专利文献l披露了一种即使没有准确发出设施名 称等输入对象的声音时也可以进行理想的声音识别的声音识别装置。在这种声 音识别装置中,地图数据储存单元储存各设施的正式名称作为基本单词。在声 音识别单元中,检测出基本单词内的派生关键字符串,使用该关键字符串将基 本单词部分地变形。据此,自动生成以其他表现形式表达与基本单词相同的设施的派生单词。例如,在基本单词"静冈县立裾野高级中学"中包含关键字符 串"静冈县立"、"高级中学"。然后,生成派生单词"裾野高级中学"或"裾 野高中"。针对识别对象,使用这样的派生单词及基本单词,进行声音识别。 所以,最好事先对每个对象储存一个单词。专利文献l:日本专利特开平11一202891号公报4在应用于以往的车载导航装置的声音识别装置中,尽管有上述的问题,但 仍然只有表现作为车载导航装置的功能的、可进行检索的类别的词汇才被录入 声音识别词典中。因此,用户在发出表达车载导航装置中无法利用的类别的词 语的声音时,会产生由于误识别为其他词语,车载导航装置进行与用户的期望 不同的行为这样的问题。本专利技术为解决上述的问题而作,其目的在于提供一种声音识别装置,可以 防止利用声音识别进行动作的装置进行与用户的期望不同的行为。
技术实现思路
为达到上述目的,本专利技术所涉及的声音识别装置包括将作为检索对象的词 汇按照类别进行存储的类别数据库,用于车载设备,包括将发出的声音转换 为电信号,作为发声数据输出的麦克风;用于识别在类别数据库中作为检索对 象的类别的词汇的第一声音识别词典;用于识别在类别数据库中作为检索对象 以外的类别的词汇的第二声音识别词典;通过将从麦克风传送来的发声数据与 第一声音识别词典及第二声音识别词典所包含的词汇对照,识别发出的声音的声音识别部;在从声音识别部传送来的作为识别结果的词语是通过与第二声音 识别词典所包含的词汇对照而得到的词语时,将表示该词语不是作为检索对象 的类别这一事实的消息作为呈现信息输出的对话控制部;以及将从对话控制部 传送来的呈现信息向外部呈现的呈现部。根据本专利技术所涉及的声音识别装置,除了用于识别在类别数据库中作为检 索对象的类别的词汇的第一声音识别词典之外,还包括用于识别在类别数据库 中作为检索对象以外的类别的词汇的第二声音识别词典,使用发声数据和第一 声音识别词典、第二声音识别词典对发出的声音进行识别,在该识别结果是基 于第二声音识别词典得到时,呈现表示该词语不是作为检索对象的类别这一事实的消息,所以即使在发出类别数据库不能检索的词语的声音时,也能正确识 别发声的词语。其结果是,可以解决由于误识别为其他词语而导致车载导航装 置进行与用户的期望不同的行为这样的问题。另外,在识别结果是基于第二声 音识别词典得到时,呈现表示该事实的消息,所以用户可以不会感到不快地使 用声音识别功能。附图说明图1是表示应用本专利技术的实施方式1所涉及的声音识别装置的车载导航装 置的结构的方框图。图2是以对话控制处理为中心表示本专利技术的实施方式1所涉及的声音识别 装置的动作的流程图。图3是表示应用本专利技术的实施方式2所涉及的声音识别装置的车载导航装置的结构的方框图。图4是以对话控制处理为中心表示本专利技术的实施方式2所涉及的声音识别装置的动作的流程图。图5是表示应用本专利技术的实施方式3所涉及的声音识别装置的车载导航装 置的结构的方框图。图6是以对话控制处理为中心表示本专利技术的实施方式3所涉及的声音识别装置的动作的流程图。图7是表示应用本专利技术的实施方式4所涉及的声音识别装置的车载导航装置的结构的方框图。图8是以词典更新处理为中心表示本专利技术的实施方式4所涉及的声音识别装置的动作的流程图。图9是表示应用本专利技术的实施方式5所涉及的声音识别装置的车载导航装 置的结构的方框图。图10是以对话控制处理为中心表示本专利技术的实施方式5所涉及的声音识 别装置的动作的流程图。图11是以由声音识别服务器进行的处理为中心表示本专利技术的实施方式5 所涉及的声音识别装置的动作的流程图。具体实施例方式下面,为更详细地说明本专利技术,参照附图来说明用于实施本专利技术的最佳方 式。另外,在以下的说明中,说明本专利技术的实施方式所涉及的声音识别装置被 应用于作为车载设备的车载导航装置的情况。实施方式1图1是表示本专利技术的实施方式1所涉及的声音识别装置的结构的方框图。 该声音识别装置包括麦克风(以下简称为"麦克")1、声音识别词典2、声 音识别部3、对话控制部4以及呈现部5。另外虽然未图示,但应用该声音识 别装置的车载导航装置包括将作为检索对象的词汇按照类别进行存储的类别 数据库作为检索数据库。麦克1将用户发出的声音转换为电信号,作为发声数据传送至声音识别部3。声音识别词典2包括第一声音识别词典2a和第二声音识别词典2b。第一声 音识别词典2a存储着在车载导航装置中可以作为检索对象的类别(以下称作 "导航检索对象类别")的词汇,换言之在类别数据库中作为检索对象的类别 的词汇(例如车站、高速公路的出入口、医院等)。第二声音识别词典2b存 储着不在导航装置的检索对象范围内的类别(以下称作"导航检索对象以外类 别")的词汇,换言之在类别数据库中作为检索对象以外的类别的词汇(例如 学校、洗手间等)。声音识别部3保存从麦克1传送来的发声数据,并且通过将该保存的发声 数据与声音识别词典2 (第一声音识别同典2a及第二声音识别词典2b)所存 储的词汇对照,识别用户发出的声音。该声音识别部3的识别结果传送至对话 控制部4。对话控制部4在从声音识别部3传送来的识别结果表示通过与第一声音识 别词典2a所包含的词汇对照而识别出时输出识别出的词语,在从声音识别部3 传送来的识别结果表示通过与第二声音识别词典2b所包含的词汇对照而识别 出时输出表示该事实的消息。据此,控制与用户的对话。从该对话控制部4输 出的词语或者消息传送至呈现部5。呈现部5例如由扬声器构成,将从对话控制部4传送来的词语或者消息以 声音形式输出。该呈现部5也可以由显示器构成。此时,从对话控制部4传送 来的词语或者消息显示在显示器的画面上。另外,呈现部5也可以由扬声器和 显示器两者构成。接下来,以由对话控制部4进行的对话控制处理为中心,参照图2所示的 流程图来说明如上所述构成的本专利技术的实施方式l所涉及的声音识别装置的本文档来自技高网
...

【技术保护点】
一种声音识别装置,包括将作为检索对象的词汇按照类别进行存储的类别数据库,该声音识别装置用于车载设备,包括: 将发出的声音转换为电信号来作为发声数据输出的麦克风; 用于识别在所述类别数据库中作为检索对象的类别的词汇的第一声音识别词 典; 用于识别在所述类别数据库中作为检索对象以外的类别的词汇的第二声音识别词典; 通过将从所述麦克风传送来的发声数据与所述第一声音识别词典及所述第二声音识别词典所包含的词汇对照,识别发出的声音的声音识别部; 在从所述声音识 别部传送来的作为识别结果的词语是通过与所述第二声音识别词典所包含的词汇对照而得到的词语时,将表示该词语不是作为检索对象的类别的消息作为呈现信息来输出的对话控制部;以及 将从所述对话控制部传送来的呈现信息向外部呈现的呈现部。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:竹里尚嘉
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1