声音识别装置和声音识别方法制造方法及图纸

技术编号:3899641 阅读:159 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种声音识别装置和声音识别方法。在对登记在单词辞典中的识别单词赋予舍弃单词时,声音分析部从与多个舍弃单词候选分别对应的多个声音数据中分别提取特征参数。声音对照部计算由声音分析部提取出的特征参数、与由单词模型生成部生成的各识别单词的单词模型之间的似然度。结果判定部针对各特征参数将似然度最高的单词模型作为识别结果。舍弃单词生成部根据针对各特征参数的识别结果,对于每一个舍弃单词候选,对希望登记舍弃单词的识别单词是识别结果的发音数进行计数,将所计数的发音数最多的舍弃单词候选作为与识别单词对应的舍弃单词登记在单词辞典中。

【技术实现步骤摘要】

本专利技术涉及根据声音信号与预先登记的识别单词之间的相似度来判 断所述声音信号是所述识别单词的哪一个并输出识别结果的声音识别装 置、该声音识别装置的声音识别方法以及记录有用于通过计算机来实现 所述声音识别装置的计算机程序的记录介质。
技术介绍
在现有的声音识别装置中,具有如下的装置其预先准备了登记有 识别单词的信息的单词辞典、和登记有舍弃单词的信息的舍弃单词辞典(例如,参照日本特开200M47698号公报、日本特许第3105863号公报)。 这种声音识别装置将由说话者输入的声音信息与登记在单词辞典和舍弃 单词辞典中的信息进行比较,确定与所输入的声音信息最相似的单词。 并且,如果所确定的单词是识别单词,则声音识别装置作为识别结果而 输出所述识别单词,如果所确定的单词是舍弃单词,则声音识别装置作 为没有识别结果而舍弃所输入的声音信息。在如上所述使用舍弃单词辞典的结构中,对于与舍弃单词的相似度 为第1位的声音信息,无论使用哪种单词辞典都会被舍弃。因此,有时 会采取以下的对策不把可能对识别结果产生不良影响的舍弃单词登记 在舍弃单词辞典中。但是,即使不把这种舍弃单词登记在舍弃单词辞典 中,也存在不能得到适当的识别结果的情况。具体而言,例如考虑希望得到"OKINAWA"作为所输入的声音信息 的识别结果的情况。此外,在针对所输入的声音信息以100分满分表示 相似度的情况下,假设"OKINAA"得到98分的相似度,"OKINAKA" 得到95分的相似度,"OKINAWA"得到93分的相似度。此处,假设在单词辞典中登记有"OKINAKA"和"OKINAWA"的信息,在舍弃单词辞典中登记有"OKINAA"的信息。此处,由于在舍 弃单词辞典中登记了相似度最高的"OKINAA"的信息,因此作为没有 识别结果而舍弃所输入的声音信号。另一方面,假设在单词辞典中登记有"OKINAKA"和"OKINAWA" 的信息,而在舍弃单词辞典中没有登记"OKINAA"的信息。此处,在 单词辞典和舍弃单词辞典中都没有登记相似度最高的"OKINAA"的信 息,而在单词辞典中登记了相似度第二高的"OKINAKA"的信息,因此 输出"OKINAKA"作为识别结果。如上所述,针对按照相似度从高到低的顺序识别为"OKINAA"、 "OKINAKA"、 "OKINAWA"的声音信息,无论是将"OKINAA"登记 为舍弃单词的情况下,还是不登记"OKINAA"的情况下,都不能得到 适当的识别结果"OKINAWA"。因此,提出了以下装置对于每个识别单词确定与未知词模型的似 然度(相似度)相乘的权重,将乘以权重后的未知词模型的似然度与识 别结果进行比较,决定识别结果的采用或舍弃(例如,参照日本特开平 10-171488号公报)。此外,提出了以下结构的系统根据登记在单词辞 典中的识别单词的特性,生成适当的舍弃单词并登记在舍弃单词辞典中 (例如,参照日本特开2006-154658号公报)。在上述声音识别装置中,未知词模型、与未知词模型相乘的权重大 多是根据某种方法人工确定并登记的,在这种情况下,很难确定最恰当 的未知词模型。此外,登记在舍弃单词辞典中的舍弃单词例如是根据识 别单词的特征而生成的,在这种情况下,不能将没有根据识别单词的特 征生成为舍弃单词的单词作为舍弃单词。
技术实现思路
本申请正是鉴于相关的情况而完成的,其目的在于提供一种能够提 高声音识别处理的精度的声音识别装置、声音识别方法以及记录介质。本申请公开的声音识别装置具有存储多个识别单词的单词辞典,从 声音信号提取特征量,使用所提取的特征量来分别计算所述声音信号与存储在单词辞典中的各个识别单词的之间相似度,将计算出的相似度高 的识别单词作为识别结果进行输出。在本申请公开的声音识别装置中,单词辞典构成为与识别单词对应地存储舍弃单词,该舍弃单词规定是否 从识别结果中排除该识别单词,使用所提取的特征量计算所述声音信号 与存储在单词辞典中的识别单词和舍弃单词各自之间的相似度。并且, 声音识别装置判断计算出的相似度高的单词是否是舍弃单词,在判断为 是舍弃单词时,不将与该舍弃单词对应地存储在单词辞典中的识别单词作为识别结果。此外,如果计算出的相似度高的单词是识别单词,则声 音识别装置将该识别单词作为识别结果进行输出。根据本申请公开的声音识别装置,在声音识别处理对象的声音信号 被识别为登记在单词辞典中的舍弃单词时,从识别结果中排除与该舍弃 单词对应地登记在单词辞典中的识别单词。即,关于对与希望作为识别 结果得到的单词(识别单词)相似的单词(相似单词)进行发音时的声 音信号,当该声音信号被识别为与所述识别单词不同的单词(识别单词) 时,将所述相似单词登记为针对所述不同单词的舍弃单词。由此,所述 声音信号被识别为针对所述不同单词的舍弃单词,并从识别结果中排除 所述不同的单词,因此能够防止错误识别。在本申请公开的声音识别装置中,即使在与希望作为识别结果得到 的识别单词相似的单词的声音信号被识别为不同的识别单词的可能性高 的情况下,也不会将所述不同的识别单词作为识别结果,因此能够得到 适当的识别结果并提高声音识别处理的精度。附图说明图1是表示实施方式1的声音识别装置的结构的框图2A和图2B是表示单词辞典和带读法的声音数据的结构的示意图3是表示实施方式1的声音识别装置的功能结构的功能框图; 图4是表示登记有舍弃单词的单词辞典的结构的示意图; 图5是表示舍弃单词登记处理的步骤的流程图;图6是表示舍弃单词登记处理的步骤的流程图7是表示声音识别处理的步骤的流程图8是表示实施方式2的带读法的声音数据的结构的示意图9是表示舍弃单词登记处理的步骤的流程图;以及图IO是表示舍弃单词登记处理的步骤的流程图。具体实施例方式以下,根据表示各实施方式的附图来详细叙述本申请公开的声音识 别装置、声音识别方法以及计算机程序。另外,在以下的各实施方式中 说明了以下结构公知的个人计算机等读取本申请公开的计算机程序, 由个人计算机的CPU (Central Processing Unit:中央处理单元)等执行该 计算机程序,从而实现本申请公开的声音识别装置。但是,也可以通过 发挥等同作用的硬件来实现本申请公开的声音识别装置。 (实施方式1)以下,根据表示实施方式1的附图来详细叙述本申请公开的声音识 别装置。图1是表示实施方式1的声音识别装置的结构的框图。本实施 方式1的声音识别装置1例如是公知的个人计算机,具有控制部10、ROM (Read Only Memory:只读存储器)11、 RAM (Random Access Memory: 随机存取存储器)12、硬盘驱动器(以下,称作HDD) 13、操作部14 和显示部15等,这些硬件的各个部分分别经由总线la相互连接。控制部10是CPU或MPU (Micro Processor Unit:微处理器)等, 将预先存储在ROM 11或HDD 13中的控制程序读取到适当的RAM 12 中并执行该控制程序,并且控制上述硬件各个部分的动作。ROM 11预先 存储有用于使声音识别装置1作为本专利技术的声音识别装置进行工作所需 要的各种控制程序。RAM 12是SRAM或闪存等,临时存储控制部10执 行控制程序时所产生的本文档来自技高网
...

【技术保护点】
一种声音识别装置,该声音识别装置具有: 从声音信号提取特征量的提取部; 存储多个识别单词的单词辞典;以及 对照部,其使用所述提取部提取出的特征量来计算所述声音信号与存储在所述单词辞典中的各个识别单词之间的相似度,将计算出的 相似度高的识别单词作为识别结果进行输出,其中 在所述单词辞典中,与所述识别单词对应地存储了规定是否从识别结果中排除该识别单词的舍弃单词,并且 所述对照部使用所述提取部提取出的特征量来计算所述声音信号与存储在所述单词辞典中的识别单 词和舍弃单词各自之间的相似度,判断所计算出的相似度高的单词是否是舍弃单词,在判断为舍弃单词时,从识别结果中排除与该舍弃单词对应地存储在所述单词辞典中的识别单词。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:原田将治
申请(专利权)人:富士通株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1