【技术实现步骤摘要】
本专利技术涉及到一种装置和方法,用来识别语音,并在语音被误识别时, 确定与用户说出所述语音或说出输入句子的方式相关的问题。
技术介绍
近年来,用户能够利用语音来输入句子的语音识别系统已经具有了实 际用途,并开始作为实际系统而用在各种领域中。然而,迄今为止,还没 有一个系统得到用户的支持并具有非常好的销售量。原因之一在于,语音 识别系统有时会对输入语音进行误识别。尽管由于技术的进步,识别性能 在逐年提高,但仍然没有一种语音识别系统,其性能高到足以对所有用户 的各种说话方式进行正确的识别。为了处理这种情形,提出了各种方法来提高语音识别系统的性能水平。例如,JP-A 2003-280683 (KOKAI)提出了一种技术,根据每个输入句子 的所属领域,改变语音识别处理中要处理的识别词汇,使得根据每个输入 句子为合适的词汇和合适的同音异义词赋予较高的优先级,从而提高识别 性能。另夕卜,在目前可用的语音识别系统中,有时通过改善使用方法可以避 免误识别。例如, 一般的说,当用户向语音识别系统输入语音发声时,希 望用户用恒定的节奏流畅地、慢慢地、仔细地、明白地说话。另外, 对于 ...
【技术保护点】
一种语音识别装置,包括: 范句存储单元,用于存储范句; 信息存储单元,用于存储彼此进行了对应的若干状态和若干条输出信息,每个所述状态基于语音输入和任何所述范句之间的差异部分和差异内容提前被确定,而每条所述输出信息涉及相应差异的产 生原因; 输入单元,该单元接收语音的输入; 第一识别单元,该第一识别单元基于用来确定音素的声学特性的声学模型和用来确定各词素之间的连接关系的语言模型将所输入的语音识别为词素串; 句子获取单元,该单元从所述范句存储单元中获取 一个与所输入的语音相关的范句; 句子对应进行单元,该单元基于所识别出的 ...
【技术特征摘要】
JP 2007-11-26 304171/20071. 一种语音识别装置,包括范句存储单元,用于存储范句;信息存储单元,用于存储彼此进行了对应的若干状态和若干条输出信息,每个所述状态基于语音输入和任何所述范句之间的差异部分和差异内容提前被确定,而每条所述输出信息涉及相应差异的产生原因;输入单元,该单元接收语音的输入;第一识别单元,该第一识别单元基于用来确定音素的声学特性的声学模型和用来确定各词素之间的连接关系的语言模型将所输入的语音识别为词素串;句子获取单元,该单元从所述范句存储单元中获取一个与所输入的语音相关的范句;句子对应进行单元,该单元基于所识别出的词素串中所包含的每个第一词素与所获取的范句中所包含的任何第二词素的匹配程度将所述每个第一词素与至少一个所述第二词素进行对应;差异探查单元,该单元探查与相应的一个所述第二词素不匹配的一个或多个所述第一词素,将其作为所述差异部分;信息获取单元,该单元从所述信息存储单元中获取与每个探查出的所述差异部分的状态相对应的一条输出信息;以及输出单元,该单元输出所获取的输出信息。2. 根据权利要求l所述的装置,还包括第二识别单元,该单元基于所述声学模型以及定义与单音节相对应的 词汇的词典信息,将所述输入的语音识别为单音节串;以及音节对应进行单元,该单元将所识别出的单音节串中所包含的每个单 音节与在所述输入的语音中有匹配的发声片段的所述第 一词素中所包含的 任何音节进^f亍对应,其中,所述差异探查单元还探查一个或多个所含音节与相应的单音节不匹配的所述第一词素,将其作为所述差异部分。3. 根据权利要求l所述的装置,其中,所述句子获取单元从所述范句 存储单元中获取一个指定的范句,作为与所述输入的语音相关的一个范句。4. 根据权利要求l所述的装置,其中,所述句子获取单元从所述范句 存储单元中获取与所述输入的语音类似或与所述输入的语音完全匹配的一 个范句。5. 根据权利要求4所述的装置,其中,所述差异探查单元计算每个所述第一词素中与相应的一个所述第二词素中的字符不匹配的字符的数目, 计算每个所述第一词素中所述字符数目与字符总数的比值,并探查一个或 多个所述比值小于预定阈值的所述第一词素,将其作为差异部分。6. 根据权利要求l所述的装置,还包括声学信息探查单元,该单元探查若干条声学信息,每条声学信息都显 示了所述输入的语...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。