声音识别装置制造方法及图纸

技术编号:7141190 阅读:260 留言:0更新日期:2012-04-11 18:40
本发明专利技术的声音识别装置包括:声音输入装置(11),该声音输入装置(11)输入所发出的按钮名称的声音并将其转换成电信号;声音识别处理部(12),该声音识别处理部(12)根据从声音输入装置作为电信号发送来的声音信号来执行声音识别处理;候选按钮检测部(13),该候选按钮检测部(13)对具有与由声音识别处理部得到的识别结果有部分一致的按钮名称的按钮进行检测以作为候选按钮;显示控制部(15),该显示控制部(15)在由候选按钮检测部检测出多个候选按钮的情况下,生成表示如下状态的画面,该状态为选择该多个候选按钮中的至少一个按钮;及显示装置(16),该显示装置(16)显示由显示控制部生成的画面。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种利用声音来操作例如导航装置等设备的声音识别装置,特别涉及 一种利用声音操作来进行与手动操作相同的步序的技术。
技术介绍
在利用声音对设备进行操作的情况下,若用户的发音模糊,则无法唯一决定操作 内容。为了解决该问题,以往一般使用如下方法由设备呈现作为声音识别结果的候选项, 用户从该候选中选择并确定正确的候选。然而,存在如下问题该方法中要转移至手动操作 中不存在的声音操作所特有的画面,因此用户难以获知操作的步序。为了解决这种因发音的模糊性而引起的问题,专利文献1披露了如下的信息输入 输出装置用户可利用声音对解释结果进行修正,用户还可利用声音对解释结果的候选进 行选择。该信息输入输出装置中,输入解释候选暂定输出部生成用于使用户从由输入装置 得到的各解释候选中选择候选的暂定呈现信息。定时器部随着暂定呈现信息的输出而开始 计时动作,在经过预定时间后产生定时器信号。解释信息选择·确定部在从声音识别装置 输入用于选择候选的声音信息时,或者在从定时器部产生定时器信号时,从各解释候选中 选择一个候选,提供给信息处理装置以作为解释信息。输出合并部对来自信息处理装置的 输出信息和来自输入解释候选集合暂定输出部的暂定呈现信息进行合并,将其提供给输出 装置以作为对用户的输出信息。专利文献1 日本专利特开平10-91309号公报然而,在上述的专利文献1所披露的技术中,存在如下问题由于不知道正确的声 音命令,因此用户的发音内容变得模糊,用户难以利用声音对其进行修正。
技术实现思路
本专利技术是为了解决上述问题而完成的,其课题在于提供一种能以相同的步序进行 手动操作和声音操作的声音识别装置。为了解决上述问题,本专利技术所涉及的声音识别装置包括声音输入装置,该声音输 入装置输入所发出的按钮名称的声音并将其转换成电信号;声音识别处理部,该声音识别 处理部根据从声音输入装置作为电信号发送来的声音信号来执行声音识别处理;候选按钮 检测部,该候选按钮检测部对具有与由声音识别处理部得到的识别结果有部分一致的按钮 名称的按钮进行检测以作为候选按钮;显示控制部,该显示控制部在由候选按钮检测部检 测出多个候选按钮的情况下,生成表示如下状态的画面,该状态为选择该多个候选按钮中 的至少一个按钮;及显示装置,该显示装置显示由显示控制部生成的画面。根据本专利技术所涉及的声音识别装置,由于采用如下结构对具有与声音识别的结 果有部分一致的按钮名称的按钮进行检测以作为候选按钮,在检测出多个候选按钮的情况 下,在画面上显示选择该多个候选按钮中的至少一个按钮的状态且用户可按下按钮,因此 即使用户的发音模糊,也能以与手动操作相同的步序进行声音操作。附图说明图1是表示本专利技术的实施方式1所涉及的声音识别装置的结构的方框图。图2是以从识别声音开始直到将识别结果呈现给用户为止的声音操作处理为中 心、来表示本专利技术的实施方式1所涉及的声音识别装置的动作的流程图。图3是用于说明本专利技术的实施方式1所涉及的声音识别装置中检测出一个候选按 钮的情况下的动作的图。图4是用于说明本专利技术的实施方式1所涉及的声音识别装置中检测出多个候选按 钮的情况下的动作的图。图5是以操作未完成时从追加操作开始直到操作完成为止的声音操作处理为中 心、来表示本专利技术的实施方式1所涉及的声音识别装置的动作的流程图。图6是以操作未完成时发出按钮名称以外的声音而使操作完成的声音操作处理 为中心、来表示本专利技术的实施方式1所涉及的声音识别装置的动作的流程图。图7是表示本专利技术的实施方式2所涉及的声音识别装置的结构的方框图。图8是以从识别声音开始直到将识别结果呈现给用户为止的声音操作处理为中 心、来表示本专利技术的实施方式2所涉及的声音识别装置的动作的流程图。具体实施例方式下面,为了更详细地说明本专利技术,根据附图对用于实施本专利技术的方式进行说明。实施方式1.图1是表示本专利技术的实施方式1所涉及的声音识别装置的结构的方框图。该声音 识别装置包括声音输入装置11、声音识别处理部12、候选按钮检测部13、手动操作装置14、 显示控制部15、显示装置16、各种功能执行部17、响应声音生成部18及声音输出装置19。声音输入装置11例如由话筒构成,将用户发出的声音转换成电信号,作为声音信 号发送到声音识别处理部12。声音识别处理部12根据从声音输入装置11发送来的声音信号来执行声音识别处 理。声音识别处理包含从所输入的声音信号中检测出发音的区间的声音区间检测处理、将 由声音区间检测处理检测出的声音信号转换成声响参数的声响分析处理、根据由声响分析 处理得到的声音的最小单位来选出并识别最大似然度的音素候选的概率运算处理、及对由 概率运算处理得到的音素和存储单词等的词典进行比较来决定识别结果的比对处理。在声响分析处理中,例如利用LPC (Linear Predictor Coefficient 线性预测系 数)梅尔倒谱或MFCC(Mel Frequency Cepstrum Coefficient 梅尔频率倒谱系数)等,将 所输入的声音信号转换成特征向量序列,推定声谱的轮廓(波谱包络)。在概率运算处理 中,例如利用HMM(Hidden MarkovModel 隐马尔可夫模型)等,使用根据所输入的声音由声 响分析处理提取出的声响参数,进行声音信号的音素编码,并与预先准备的标准音素模型 进行比较,选出最大似然度的音素候选。在比对处理中,通过将音素候选与词典进行比较, 从而选择似然度较高的单词。声音识别处理部12中利用上述处理得到的识别结果被发送 到候选按钮检测部13及显示控制部15。候选按钮检测部13对由声音识别处理部12得到的识别结果、和从显示控制部15获取到的所有按钮的名称(以下称为“按钮名称”)、即该声音识别装置中所准备的所有 画面上存在的所有按钮的按钮名称进行比较,对具有与识别结果有部分一致的按钮名称的 按钮进行检测以作为候选按钮。例如,识别结果为“YYY”,在准备了 “XXXXXX”、“YYYABC”、 “YYYDEF”及“ZUUZ”以作为按钮名称的情况下,具有与“YYY”有部分一致的诸如“YYYABC” 及“YYYDEF”的按钮名称的两个按钮被检测作为候选按钮。这里,识别结果和按钮名称有部 分一致是指声音操作有模糊的情况。此外,识别结果和按钮名称完全一致是指进行了正确的声音操作的情况,候选按 钮检测部13将表示完全一致的意思通知显示控制部15及各种功能执行部17(图1中省略 了通知的路径)。在这种情况下,进行与利用手动操作装置14按下按钮的情况相同的动作。 表示由该候选按钮检测部13检测出的候选按钮的信息作为候选按钮数据被发送到显示控 制部15、各种功能执行部17及响应声音生成部18。手动操作装置14例如在用户按下显示在显示装置16的画面上的按钮时使用。该 手动操作装置14可由设置在声音识别装置的前面板上的操作按钮、产生与该操作按钮相 同的信号的远程控制器(遥控器)、载放在显示装置16的画面上的触摸屏、或者它们的组合 来构成。通过操作该手动操作装置14而产生的操作按钮数据被发送到显示控制部15及各 种功能执行部17。显示控制部15根据从候选按钮检测部13发送来的候选按钮数据或从手动操作装 置14发送来的操作按钮数据,生成用于将图像显示在本文档来自技高网...

【技术保护点】
1.一种声音识别装置,其特征在于,包括:声音输入装置,该声音输入装置输入所发出的按钮名称的声音并将其转换成电信号;声音识别处理部,该声音识别处理部根据从所述声音输入装置作为电信号发送来的声音信号来执行声音识别处理;候选按钮检测部,该候选按钮检测部对具有与由所述声音识别处理部得到的识别结果有部分一致的按钮名称的按钮进行检测以作为候选按钮;显示控制部,该显示控制部在由所述候选按钮检测部检测出多个候选按钮的情况下,生成表示如下状态的画面,该状态为选择该多个候选按钮中的至少一个按钮;及显示装置,该显示装置显示由所述显示控制部生成的画面。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:井上让
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1