语音识别装置和语音识别方法制造方法及图纸

技术编号：5383465 阅读：165 留言：0更新日期：2012-04-11 18:40

距离计算单元（１６）获取输入语音的特征量和每个音素模型之间的声音距离。单词搜索单元（１７）基于声音距离以及包括单词的音素和韵律标记的语言模型来执行单词搜索，并且输出单词假说以及表示该单词假说的似然度的第一分数。单词搜索单元（１７）还输出当假设输入语音的识别结果为该单词假说时，语音中的元音间隔及其音调标记。音调识别单元（２１）基于与从单词搜索单元（１７）输出的元音间隔相对应的特征量，输出表示从单词搜索单元（１７）输出的音调标记的似然度的第二分数。重判单元（２２）利用从音调识别单元（２１）输出的第二分数来校正从单词搜索单元（１７）输出的单词假说的第一分数。这使得能够提高音调语音的语音识别精度。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及语音识别技术，并且更具体地涉及用于使用诸如音调(tone)(语调， voice tone)之类的韵律的语言的语音识别技术。
技术介绍
存在使用韵律的各种语言。例如，汉语使用称为音调的韵律。音调是用来在含义之间进行区分的音高(sound pitch)模式，并且主要地，元音(vowel)具有诸如升调和降调之类的特有音调。因此，对于汉语语音识别，识别出音调是很重要的。在日本专利No. 3162994(参考文献1)中公开的技术被称为使用音调的语音识别技术。在参考文献1中描述的汉语语音识别技术将音节(syllable)划分为第一半部分和第二半部分，仅将音节的第二半部分与音调相关联，并且利用经关联的音调来识别语音。由于语音识别是利用音调来执行的，因此，与未使用音调的技术相比，这种技术可以使语调语音识别更准确。
技术实现思路
本专利技术解决的问题然而，参考文献1的技术简单地将音节划分为第一半部分和第二半部分，并且第二半部分可以包括辅音(consonant)。因此，即使对于没有语调的辅音也可以进行音调识别。在此情况中，音调识别结果可能不准确，并且语音识别精度可能降低。本专利技术的一个示例性目的是提高对于具有诸如音调之类的韵律的语言的语音识别精度。解决问题的手段根据本专利技术一个示例性方面的语音识别装置包括单词搜索装置，用于基于音素模型与输入语音的特征量之间的声音距离以及包括单词的音素和韵律标记的语言模型中的单词的音素来执行单词搜索，将单词假说和表示所述单词假说的似然度(likelihood) 的第一分数输出为单词搜索结果，并且在假设...

【技术保护点】
一种语音识别装置，包括：单词搜索装置，用于基于音素模型与输入语音的特征量之间的声音距离以及包括单词的音素和韵律标记的语言模型中的单词的音素来执行单词搜索，将单词假说和表示所述单词假说的似然度的第一分数输出为单词搜索结果，并且在假设所述输入语音的识别结果为所述单词假说时，输出所述输入语音中的韵律间隔以及所述韵律间隔的韵律标记；韵律识别装置，用于基于所述输入语音的特征量中与从所述单词搜索装置输出的所述韵律间隔相对应的一个特征量，来输出表示从所述单词搜索装置输出的所述韵律标记的似然度的第二分数；以及重判装置，用于利用从所述韵律识别装置输出的所述第二分数来校正从所述单词搜索装置输出的所述单词假说的第一分数。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：花泽健，
申请(专利权)人：日本电气株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人