语音识别装置及方法制造方法及图纸

技术编号：3048205 阅读：224 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及语音识别装置及方法。在该装置中，相连字识别单元基于声学模型和语言模型将语音识别为词素串。句子获取单元从正确句子存储单元中获取与所述语音相关的范句。基于匹配程度，句子对应进行单元将所识别出的词素串中所包含的第一词素与所获得的范句中所包含的第二词素进行对应。差异探查单元探查一个或多个与相对应的所述第二词素不匹配的所述第一词素，将其作为差异部分。原因信息获取单元从原因信息存储单元中获取输出信息，该输出信息对应着每个所述差异所符合的状态。输出单元输出所获得的输出信息。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及到一种装置和方法，用来识别语音，并在语音被误识别时，确定与用户说出所述语音或说出输入句子的方式相关的问题。
技术介绍
近年来，用户能够利用语音来输入句子的语音识别系统已经具有了实际用途，并开始作为实际系统而用在各种领域中。然而，迄今为止，还没有一个系统得到用户的支持并具有非常好的销售量。原因之一在于，语音识别系统有时会对输入语音进行误识别。尽管由于技术的进步，识别性能在逐年提高，但仍然没有一种语音识别系统，其性能高到足以对所有用户的各种说话方式进行正确的识别。为了处理这种情形，提出了各种方法来提高语音识别系统的性能水平。例如，JP-A 2003-280683 (KOKAI)提出了一种技术，根据每个输入句子的所属领域，改变语音识别处理中要处理的识别词汇，使得根据每个输入句子为合适的词汇和合适的同音异义词赋予较高的优先级，从而提高识别性能。另夕卜，在目前可用的语音识别系统中，有时通过改善使用方法可以避免误识别。例如，一般的说，当用户向语音识别系统输入语音发声时，希望用户用恒定的节奏流畅地、慢慢地、仔细地、明白地说话。另外，对于要输入语音识别系统中的句子，希望句子中的许多单词和表达法在语法上是正确的并且是常用的，，。掌握了这种使用方法的用户与没有掌握这种使用方法的用户，其正确识别的百分比大大地不同。此外，由于不同用户具有不同的语音特征，所以，什么类型的语音会5导致什么类型的误识别会根据用户的不同而变化4艮大。另外，根据语音识别系统所使用的数据库中所存储的数据的倾向的不同，误识别的倾向也会变化很大。因此，没有一种使...

【技术保护点】
一种语音识别装置，包括：　范句存储单元，用于存储范句；　信息存储单元，用于存储彼此进行了对应的若干状态和若干条输出信息，每个所述状态基于语音输入和任何所述范句之间的差异部分和差异内容提前被确定，而每条所述输出信息涉及相应差异的产生原因；　输入单元，该单元接收语音的输入；　第一识别单元，该第一识别单元基于用来确定音素的声学特性的声学模型和用来确定各词素之间的连接关系的语言模型将所输入的语音识别为词素串；　句子获取单元，该单元从所述范句存储单元中获取一个与所输入的语音相关的范句；　句子对应进行单元，该单元基于所识别出的词素串中所包含的每个第一词素与所获取的范句中所包含的任何第二词素的匹配程度将所述每个第一词素与至少一个所述第二词素进行对应；　差异探查单元，该单元探查与相应的一个所述第二词素不匹配的一个或多个所述第一词素，将其作为所述差异部分；　信息获取单元，该单元从所述信息存储单元中获取与每个探查出的所述差异部分的状态相对应的一条输出信息；以及　输出单元，该单元输出所获取的输出信息。

【技术特征摘要】
JP 2007-11-26 304171/20071. 一种语音识别装置，包括范句存储单元，用于存储范句；信息存储单元，用于存储彼此进行了对应的若干状态和若干条输出信息，每个所述状态基于语音输入和任何所述范句之间的差异部分和差异内容提前被确定，而每条所述输出信息涉及相应差异的产生原因；输入单元，该单元接收语音的输入；第一识别单元，该第一识别单元基于用来确定音素的声学特性的声学模型和用来确定各词素之间的连接关系的语言模型将所输入的语音识别为词素串；句子获取单元，该单元从所述范句存储单元中获取一个与所输入的语音相关的范句；句子对应进行单元，该单元基于所识别出的词素串中所包含的每个第一词素与所获取的范句中所包含的任何第二词素的匹配程度将所述每个第一词素与至少一个所述第二词素进行对应；差异探查单元，该单元探查与相应的一个所述第二词素不匹配的一个或多个所述第一词素，将其作为所述差异部分；信息获取单元，该单元从所述信息存储单元中获取与每个探查出的所述差异部分的状态相对应的一条输出信息；以及输出单元，该单元输出所获取的输出信息。2. 根据权利要求l所述的装置，还包括第二识别单元，该单元基于所述声学模型以及定义与单音节相对应的词汇的词典信息，将所述输入的语音识别为单音节串；以及音节对应进行单元，该单元将所识别出的单音节串中所包含的每个单音节与在所述输入的语音中有匹配的发声片段的所述第一词素中所包含的任何音节进^f亍对应，其中，所述差异探查单元还探查一个或多个所含音节与相应的单音节不匹配的所述第一词素，将其作为所述差异部分。3. 根据权利要求l所述的装置，其中，所述句子获取单元从所述范句存储单元中获取一个指定的范句，作为与所述输入的语音相关的一个范句。4. 根据权利要求l所述的装置，其中，所述句子获取单元从所述范句存储单元中获取与所述输入的语音类似或与所述输入的语音完全匹配的一个范句。5. 根据权利要求4所述的装置，其中，所述差异探查单元计算每个所述第一词素中与相应的一个所述第二词素中的字符不匹配的字符的数目，计算每个所述第一词素中所述字符数目与字符总数的比值，并探查一个或多个所述比值小于预定阈值的所述第一词素，将其作为差异部分。6. 根据权利要求l所述的装置，还包括声学信息探查单元，该单元探查若干条声学信息，每条声学信息都显示了所述输入的语...

【专利技术属性】
技术研发人员：永江尚义，
申请(专利权)人：株式会社东芝，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人