【技术实现步骤摘要】
在此讨论的实施例针对的是识别装置、识别程序、识别方法、生成装置、生成程序和生成方法。
技术介绍
存在使用文件或网络页面中包括的文本来识别输入语音的装置。上述装置的例子包括这样一种装置,该装置计算指示输入语音的语音信号和文本中包括的词或其中词被连接的字符串之间的相似度,并且将计算的相似度超过阈值时的词或字符串判断为对应于语音信号的词或字符串。进一步,使用文本来识别输入语音的装置的另一个例子包括这样一种装置,该装置生成文本中包括的词的所有连接模式,并且将生成的连接模式登记在词典(dictionary)中,所述词典可以用来识别语音以生成词典。生成词典的装置将词典中登记的连接模式与指示输入语音的语音信号相比较以识别语音。另外,当文本中包括的词的数目为η时,生成词典的装置生成多至I至η之和的连接模式。进而,使用文本来识别输入语 音的装置的另一个例子包括通过N元语法(N-gram)来重新训练语言模型的装置。相对于从语料库训练的语言模型,重新训练语言模型的装置增加了文本中的连接词相对于其中词被连接的词串的概率。在这种情况下,重新训练语言模型的装置生成了多至文本中出现的词的数目 ...
【技术保护点】
一种识别装置,包括:存储器,其存储语句中包括的词和指示所述词在所述语句中的位置的位置信息;第一计算单元,其将输入的语音信号与连接所述存储器中存储的多个词的字符串的阅读信息相比较以计算相似度;第二计算单元,其基于所述存储器中存储的词的位置信息来计算指示多个连接的词之间接近度的连接得分;以及确定单元,其基于所述相似度和所述连接得分来确定对应于所述语音信号的字符串。
【技术特征摘要】
2011.10.12 JP 2011-2253441.一种识别装置,包括 存储器,其存储语句中包括的词和指示所述词在所述语句中的位置的位置信息; 第一计算单元,其将输入的语音信号与连接所述存储器中存储的多个词的字符串的阅读信息相比较以计算相似度; 第二计算单元,其基于所述存储器中存储的词的位置信息来计算指示多个连接的词之间接近度的连接得分;以及 确定单元,其基于所述相似度和所述连接得分来确定对应于所述语音信号的字符串。2.根据权利要求1所述的识别装置,其中,所述存储器进一步存储其中多个词被耦合的词串和指示所述词串在所述语句中的位置的位置信息, 所述第一计算单元使用所述词串作为词来计算所述相似度,并且 所述第二计算单元使用所述词串作为词来计算所述连接得分。3.根据权利要求1或2所述的识别装置,其中,所述存储器进一步存储用于标识短语的标识信息,以便与所述语句中包括的短语相关联,并且 基于所述存储器中存储的词的位置信息和标识信息,所述第二计算单元针对每一个短语计算指示多个连接的词之间接近度的连接得分。4.根据权利要求1所述的识别装置,其中,所述存储器进一步存储指示第二词连接到第一词的概率的信息,并且 基于所述存储器中存储的指示第二词连接到第一词的概率的信息,所述第二计算单元进一步校正所述连接得分。5.根据权利要求2所述的识别装置,其中,所述存储器进一步存储指示第二词连接到第一词的概率的信息,并且 基于所述存储器中存储的指示第二词连接到第一词的概率的信息,所述第二计算单元进一步校正所述连接得分。6.根据权利要求3所述的识别装置,其中,所述存储器进一步存储指示第二词连接到第一词的概率的信息,并且 基于所述存储器中存储的指示第二词连接到第一词的概率的信息,所述第二计算单元进一步校正所述连接得分。7.根据权利要求1所述的识别装置,其中,所述存储器进一步存储关于多个连接的词的词类组合适合性的信息,并且 基于所述存储器中存储的关于多...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。