声音识别系统以及声音识别方法技术方案

技术编号：15292849 阅读：164 留言：0更新日期：2017-05-11 01:44

本发明专利技术的目的在于提供一种能在抑制无用处理的同时，获得妥当性较高的识别效果的技术。声音识别装置(1)包括第1～第3声音识别部(11～13)及控制部(14)。控制部(14)在基于由第1及第2声音识别部(11、12)获取的识别结果，判定为使第3声音识别部(13)识别输入声音的情况下，利用包含由第1及第2声音识别部(11、12)中的至少一方获取的候补字符串的词典，使第3声音识别部(13)识别输入声音。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及进行要从输出部输出的声音识别的声音识别系统及声音识别方法。
技术介绍
现有的声音识别装置中使用的声音识别技术根据识别率、运算量及硬件资源而进行专门化。例如，在车载的声音识别装置中，采用专门用于车载的声音识别(本地识别)，具有较高的抗噪音性及响应性等优点。此外，例如，在识别从外部经由网络接收到的声音数据的服务器的声音识别装置中，采用专门用于服务器的声音识别(服务器识别)，具有能使用包含很多或较新词汇的词典、及能以较高运算量来进行声音识别的优点。此处，近年来，基于用途的多样化等理由，研究将本地识别和服务器识别进行组合而获得两者的优点的结构。然而，在利用多个声音识别部的结构中，各声音识别引擎的识别方式、识别使用的词典(识别词典)不同，因此，存在无法将各自的识别结果简单进行比较的问题。具体而言，在多个声音识别部的各个声音识别部中，作为声音识别的结果，决定与输入声音对应的候补字符串(与输入声音一致的可能性较高的词汇等的字符串)，并计算出表示各候补字符串的正确性(各候补字符串与输入声音一致的可能性)的得分值。然而，在对于几个候补字符串的得分值在多个声音识别部间不同的情况下，存在无法在多个声音识别部间将得分值简单进行比较的问题。因此，对于该问题，提出了各种技术。例如，专利文献1中，提出有如下技术：即，对多个声音识别部中不同的得分值进行统计学处理，标准化为可在多个声音识别部间进行比较的得分值，将得分值最高的候补字符串作为整体的识别结果进行输出。此外，例如，在专利文献2中提出有如下技术：即，在第1声音识别部中利用多个识别词典识别输入声音，将作为其结果的得分值...
<a href="http://www.xjishu.com/zhuanli/21/201480080290.html" title="声音识别系统以及声音识别方法原文来自X技术">声音识别系统以及声音识别方法</a>

【技术保护点】
一种声音识别系统，该声音识别系统进行要从输出部输出的声音识别，其特征在于，包括：第1声音识别部、第2声音识别部及第3声音识别部，该第1声音识别部、第2声音识别部及第3声音识别部通过识别输入声音来获取包含与该输入声音对应的候补字符串的识别结果；以及控制部，该控制部在基于由所述第1声音识别部及所述第2声音识别部获取的所述识别结果，判定为使所述第3声音识别部识别所述输入声音的情况下，利用包含由所述第1声音识别部及所述第2声音识别部中的至少一方获取的所述候补字符串的词典，使所述第3声音识别部识别所述输入声音，并使所述输出部输出由此得到的所述识别结果。

【技术特征摘要】
【国外来华专利技术】1.一种声音识别系统，该声音识别系统进行要从输出部输出的声音识别，其特征在于，包括：第1声音识别部、第2声音识别部及第3声音识别部，该第1声音识别部、第2声音识别部及第3声音识别部通过识别输入声音来获取包含与该输入声音对应的候补字符串的识别结果；以及控制部，该控制部在基于由所述第1声音识别部及所述第2声音识别部获取的所述识别结果，判定为使所述第3声音识别部识别所述输入声音的情况下，利用包含由所述第1声音识别部及所述第2声音识别部中的至少一方获取的所述候补字符串的词典，使所述第3声音识别部识别所述输入声音，并使所述输出部输出由此得到的所述识别结果。2.如权利要求1所述的声音识别系统，其特征在于，所述控制部在基于由所述第1声音识别部及所述第2声音识别部获取的所述识别结果，判定为不使所述第3声音识别部识别所述输入声音的情况下，使所述输出部输出由所述第1声音识别部及所述第2声音识别部中的一方获取的所述识别结果。3.如权利要求1所述的声音识别系统，其特征在于，所述第3声音识别部不仅利用包含所述候补字符串的词典，还利用所述第3声音识别部固有的词典来进行所述输入声音的识别。4.如权利要求1所述的声音识别系统，其特征在于，基于表示由所述第1声音识别部及所述第2声音识别部获取的所述候补字符串一致的程度的相似度，判定是否使所述第3声音识别部识别所述输入声音。5.如权利要求4所述的声音识别系统，其特征在于，在由所述第1声音识别部及所述第2声音识别部获取的所述识别结果并非完全一致、且所述相似度在预定的阈值以上的情况下，判定为使所述第3声音识别部识别所述输入声音，在除此以外的情况下，判定为不使所述第3声音识别部识别所述输入声音。6.如权利要求1所述的声音识别系统，其特征在于，由所述第1声音识别部及所述第2声音识别部分别获取的识别结果还包含表示所述候补字符串的正确性的得分值，基于包含由所述第1声音识别部及所述第2声音识别部分别获取的最大的所述得分值、表示由所述第1声音识别部及所述第2声音识别部获取的所述候补字符串一致的程度的相似度、表示按照由所述第1声音识别部及所述第2声音识...

【专利技术属性】
技术研发人员：杉谷直哉，冈登洋平，山崎道弘，
申请(专利权)人：三菱电机株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人