声音识别系统以及声音识别方法技术方案

技术编号:15292849 阅读:164 留言:0更新日期:2017-05-11 01:44
本发明专利技术的目的在于提供一种能在抑制无用处理的同时,获得妥当性较高的识别效果的技术。声音识别装置(1)包括第1~第3声音识别部(11~13)及控制部(14)。控制部(14)在基于由第1及第2声音识别部(11、12)获取的识别结果,判定为使第3声音识别部(13)识别输入声音的情况下,利用包含由第1及第2声音识别部(11、12)中的至少一方获取的候补字符串的词典,使第3声音识别部(13)识别输入声音。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及进行要从输出部输出的声音识别的声音识别系统及声音识别方法。
技术介绍
现有的声音识别装置中使用的声音识别技术根据识别率、运算量及硬件资源而进行专门化。例如,在车载的声音识别装置中,采用专门用于车载的声音识别(本地识别),具有较高的抗噪音性及响应性等优点。此外,例如,在识别从外部经由网络接收到的声音数据的服务器的声音识别装置中,采用专门用于服务器的声音识别(服务器识别),具有能使用包含很多或较新词汇的词典、及能以较高运算量来进行声音识别的优点。此处,近年来,基于用途的多样化等理由,研究将本地识别和服务器识别进行组合而获得两者的优点的结构。然而,在利用多个声音识别部的结构中,各声音识别引擎的识别方式、识别使用的词典(识别词典)不同,因此,存在无法将各自的识别结果简单进行比较的问题。具体而言,在多个声音识别部的各个声音识别部中,作为声音识别的结果,决定与输入声音对应的候补字符串(与输入声音一致的可能性较高的词汇等的字符串),并计算出表示各候补字符串的正确性(各候补字符串与输入声音一致的可能性)的得分值。然而,在对于几个候补字符串的得分值在多个声音识别部间不同的情况下,存在无法在多个声音识别部间将得分值简单进行比较的问题。因此,对于该问题,提出了各种技术。例如,专利文献1中,提出有如下技术:即,对多个声音识别部中不同的得分值进行统计学处理,标准化为可在多个声音识别部间进行比较的得分值,将得分值最高的候补字符串作为整体的识别结果进行输出。此外,例如,在专利文献2中提出有如下技术:即,在第1声音识别部中利用多个识别词典识别输入声音,将作为其结果的得分值较为上位的候补字符串存放在二次判定词典中,在第2声音识别部中利用该二次判定词典来识别输入声音。现有技术文献专利文献专利文献1:日本专利特开2005-003997号公报专利文献2:日本专利特开2008-197356号公报
技术实现思路
专利技术所要解决的技术问题如上述那样,在专利文献1的技术中,对多个声音识别部间不同的得分值进行统计学处理,标准化为可在多个声音识别部间进行比较的得分值。然而,例如,在多个声音识别部间计算出不同的得分值的候补字符串存在较多个的情况下,无法将得分值标准化至可适当进行比较的程度,其结果是,存在无法获得妥当性较高的识别结果的问题。此外,在专利文献2的技术中,即使在第一阶段的声音识别中获得足够正确的结果的情况下,也进行第二阶段的声音识别,因此,存在产生无用处理的问题。因此,本专利技术是鉴于上述问题而完成的,其目的在于提供一种能在抑制无用处理的同时,获得妥当性较高的识别效果的技术。解决技术问题的技术方案本专利技术的声音识别系统进行要从输出部输出的声音识别,其包括:第1声音识别部、第2声音识别部及第3声音识别部,该第1声音识别部、第2声音识别部及第3声音识别部通过识别输入声音来获取包含与该输入声音对应的候补字符串的识别结果;以及控制部,该控制部在基于由第1声音识别部及第2声音识别部获取的识别结果,判定为使第3声音识别部识别输入声音的情况下,利用包含由第1声音识别部及第2声音识别部中的至少一方获取的候补字符串的词典,使第3声音识别部识别输入声音,并使输出部输出由此得到的识别结果。此外,本专利技术的声音识别方法进行要从输出部输出的声音识别,其中,在通过识别输入声音来获取包含与该输入声音对应的候补字符串的识别结果的第1声音识别部、第2声音识别部及第3声音识别部中,基于由第1声音识别部及第2声音识别部获取的识别结果,判定为使第3声音识别部识别输入声音的情况下,利用包含由第1声音识别部及第2声音识别部中的至少一方获取的候补字符串的词典,使第3声音识别部识别输入声音,并使输出部输出由此得到的识别结果。专利技术效果根据本专利技术,可在抑制无用处理的同时,获得妥当性较高的识别效果。本专利技术的目的、特征、形态以及优点通过以下详细的说明和附图会变得更为明了。附图说明图1是表示实施方式1的声音识别装置的主要结构的框图。图2是表示实施方式1的输入声音的识别结果的一例的图。图3是表示实施方式1的声音识别装置的结构的框图。图4是用于说明实施方式1的指标的一例的图。图5是表示实施方式1的声音识别装置的动作的流程图。图6是用于说明变形例1的指标的一例的图。图7是用于说明变形例2的指标的一例的图。图8是表示实施方式2的声音识别装置的结构的框图。图9是表示其它变形例的声音识别系统的主要结构的框图。图10是表示其它变形例的声音识别系统的主要结构的框图。具体实施方式<实施方式1>在以下的说明中,主要以适用于声音识别装置单体的情况为例对本专利技术的声音识别系统进行说明。图1是表示本专利技术实施方式1的声音识别装置1的主要结构的框图。图1的声音识别装置1包括第1声音识别部11、第2声音识别部12、第3声音识别部13、控制部14及识别结果输出部15。图1的声音识别装置1进行要从作为输出部的识别结果输出部15输出的声音识别。识别结果输出部15例如可以是将通过声音识别得到的识别结果输出到其它装置的输出端子,也可以是显示识别结果的显示装置,也可以是以声音来输出识别结果的声音输出装置。另外,图1的结构中,识别结果输出部15包括在声音识别装置1中,但在识别结果输出部15为显示装置或声音输出装置等的情况下,识别结果输出部15也可不包括在声音识别装置1中,而包括在其它装置中。第1~第3声音识别部11~13例如由存储有包含多个词汇、单词或文件的词典及程序的半导体存储器等存储装置、以及中央处理器(CentralProcessingUnit,以下记为“CPU”)等处理器执行上述程序来实现的功能构成。这样构成的第1~第3声音识别部11~13通过识别输入声音,从而获取(生成)包含与输入声音对应的候补字符串(与输入声音一致的可能性较高的词汇、单词或文件等的字符串)的识别结果。图2是表示由第1~第3声音识别部11~13获取的识别结果的一例的图。本实施方式1中,第1~第3声音识别部11~13的识别结果不仅包含候补字符串,还包含表示各候补字符串的正确性(各候补字符串与输入声音一致的可能性)的得分值。以下,作为一例,设为得分值越大、候补字符串的正确性越高来进行说明。控制部14例如通过使CPU等处理器执行存储装置中存储的程序来实现。控制部14在基于由第1及第2声音识别部11、12获取的识别结果,判定为使第3声音识别部13识别输入声音的情况下,利用包含由第1及第2声音识别部11、12获取的候补字符串的词典,使第3声音识别部13识别输入声音,并使识别结果输出部15输出由此得到的识别结果。是否使第3声音识别部13进行声音识别的判定可以由声音识别装置1来进行,也可以将由第1及第2声音识别部11、12获取的识别结果提供给声音识别装置1的外部的装置,从而由该装置来进行。根据以上那样的本实施方式1的声音识别装置1,第3声音识别部13利用包含由第1及第2声音识别部11、12获取的候补字符串的词典来识别输入声音。由此,即使例如由第1及第2声音识别部11、12获取的候补字符串的得分值偏差成无法比较的程度,也可利用第3声音识别部13计算出对于该候补字符串统一基准后的得分值。即,可在实质上将第1及第2声音识别部11、12的得分值进行标准化,因此,作为其结本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/21/201480080290.html" title="声音识别系统以及声音识别方法原文来自X技术">声音识别系统以及声音识别方法</a>

【技术保护点】
一种声音识别系统,该声音识别系统进行要从输出部输出的声音识别,其特征在于,包括:第1声音识别部、第2声音识别部及第3声音识别部,该第1声音识别部、第2声音识别部及第3声音识别部通过识别输入声音来获取包含与该输入声音对应的候补字符串的识别结果;以及控制部,该控制部在基于由所述第1声音识别部及所述第2声音识别部获取的所述识别结果,判定为使所述第3声音识别部识别所述输入声音的情况下,利用包含由所述第1声音识别部及所述第2声音识别部中的至少一方获取的所述候补字符串的词典,使所述第3声音识别部识别所述输入声音,并使所述输出部输出由此得到的所述识别结果。

【技术特征摘要】
【国外来华专利技术】1.一种声音识别系统,该声音识别系统进行要从输出部输出的声音识别,其特征在于,包括:第1声音识别部、第2声音识别部及第3声音识别部,该第1声音识别部、第2声音识别部及第3声音识别部通过识别输入声音来获取包含与该输入声音对应的候补字符串的识别结果;以及控制部,该控制部在基于由所述第1声音识别部及所述第2声音识别部获取的所述识别结果,判定为使所述第3声音识别部识别所述输入声音的情况下,利用包含由所述第1声音识别部及所述第2声音识别部中的至少一方获取的所述候补字符串的词典,使所述第3声音识别部识别所述输入声音,并使所述输出部输出由此得到的所述识别结果。2.如权利要求1所述的声音识别系统,其特征在于,所述控制部在基于由所述第1声音识别部及所述第2声音识别部获取的所述识别结果,判定为不使所述第3声音识别部识别所述输入声音的情况下,使所述输出部输出由所述第1声音识别部及所述第2声音识别部中的一方获取的所述识别结果。3.如权利要求1所述的声音识别系统,其特征在于,所述第3声音识别部不仅利用包含所述候补字符串的词典,还利用所述第3声音识别部固有的词典来进行所述输入声音的识别。4.如权利要求1所述的声音识别系统,其特征在于,基于表示由所述第1声音识别部及所述第2声音识别部获取的所述候补字符串一致的程度的相似度,判定是否使所述第3声音识别部识别所述输入声音。5.如权利要求4所述的声音识别系统,其特征在于,在由所述第1声音识别部及所述第2声音识别部获取的所述识别结果并非完全一致、且所述相似度在预定的阈值以上的情况下,判定为使所述第3声音识别部识别所述输入声音,在除此以外的情况下,判定为不使所述第3声音识别部识别所述输入声音。6.如权利要求1所述的声音识别系统,其特征在于,由所述第1声音识别部及所述第2声音识别部分别获取的识别结果还包含表示所述候补字符串的正确性的得分值,基于包含由所述第1声音识别部及所述第2声音识别部分别获取的最大的所述得分值、表示由所述第1声音识别部及所述第2声音识别部获取的所述候补字符串一致的程度的相似度、表示按照由所述第1声音识别部及所述第2声音识...

【专利技术属性】
技术研发人员:杉谷直哉冈登洋平山崎道弘
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1