识别装置、识别方法、生成装置和生成方法制造方法及图纸

技术编号：8594619 阅读：209 留言：0更新日期：2013-04-18 08:02

本发明专利技术涉及识别装置、识别方法、生成装置和生成方法。根据本发明专利技术的识别装置包括存储器、第一计算单元、第二计算单元和确定单元。存储器存储语句中包括的词和指示词在语句中的位置的位置信息。第一计算单元将输入语音信号与连接存储器中存储的多个词的字符串的阅读信息相比较以计算相似度。第二计算单元基于存储器中存储的词的位置信息来计算指示多个连接的词之间接近度的连接得分。确定单元基于相似度和连接得分来确定对应于语音信号的字符串。

全部详细技术资料下载

【技术实现步骤摘要】

在此讨论的实施例针对的是识别装置、识别程序、识别方法、生成装置、生成程序和生成方法。
技术介绍
存在使用文件或网络页面中包括的文本来识别输入语音的装置。上述装置的例子包括这样一种装置，该装置计算指示输入语音的语音信号和文本中包括的词或其中词被连接的字符串之间的相似度，并且将计算的相似度超过阈值时的词或字符串判断为对应于语音信号的词或字符串。进一步，使用文本来识别输入语音的装置的另一个例子包括这样一种装置，该装置生成文本中包括的词的所有连接模式，并且将生成的连接模式登记在词典(dictionary)中，所述词典可以用来识别语音以生成词典。生成词典的装置将词典中登记的连接模式与指示输入语音的语音信号相比较以识别语音。另外，当文本中包括的词的数目为η时，生成词典的装置生成多至I至η之和的连接模式。进而，使用文本来识别输入语音的装置的另一个例子包括通过N元语法(N-gram)来重新训练语言模型的装置。相对于从语料库训练的语言模型，重新训练语言模型的装置增加了文本中的连接词相对于其中词被连接的词串的概率。在这种情况下，重新训练语言模型的装置生成了多至文本中出现的词的数目...

【技术保护点】
一种识别装置，包括：存储器，其存储语句中包括的词和指示所述词在所述语句中的位置的位置信息；第一计算单元，其将输入的语音信号与连接所述存储器中存储的多个词的字符串的阅读信息相比较以计算相似度；第二计算单元，其基于所述存储器中存储的词的位置信息来计算指示多个连接的词之间接近度的连接得分；以及确定单元，其基于所述相似度和所述连接得分来确定对应于所述语音信号的字符串。

【技术特征摘要】
2011.10.12 JP 2011-2253441.一种识别装置，包括存储器，其存储语句中包括的词和指示所述词在所述语句中的位置的位置信息；第一计算单元，其将输入的语音信号与连接所述存储器中存储的多个词的字符串的阅读信息相比较以计算相似度；第二计算单元，其基于所述存储器中存储的词的位置信息来计算指示多个连接的词之间接近度的连接得分；以及确定单元，其基于所述相似度和所述连接得分来确定对应于所述语音信号的字符串。2.根据权利要求1所述的识别装置，其中，所述存储器进一步存储其中多个词被耦合的词串和指示所述词串在所述语句中的位置的位置信息，所述第一计算单元使用所述词串作为词来计算所述相似度，并且所述第二计算单元使用所述词串作为词来计算所述连接得分。3.根据权利要求1或2所述的识别装置，其中，所述存储器进一步存储用于标识短语的标识信息，以便与所述语句中包括的短语相关联，并且基于所述存储器中存储的词的位置信息和标识信息，所述第二计算单元针对每一个短语计算指示多个连接的词之间接近度的连接得分。4.根据权利要求1所述的识别装置，其中，所述存储器进一步存储指示第二词连接到第一词的概率的信息，并且基于所述存储器中存储的指示第二词连接到第一词的概率的信息，所述第二计算单元进一步校正所述连接得分。5.根据权利要求2所述的识别装置，其中，所述存储器进一步存储指示第二词连接到第一词的概率的信息，并且基于所述存储器中存储的指示第二词连接到第一词的概率的信息，所述第二计算单元进一步校正所述连接得分。6.根据权利要求3所述的识别装置，其中，所述存储器进一步存储指示第二词连接到第一词的概率的信息，并且基于所述存储器中存储的指示第二词连接到第一词的概率的信息，所述第二计算单元进一步校正所述连接得分。7.根据权利要求1所述的识别装置，其中，所述存储器进一步存储关于多个连接的词的词类组合适合性的信息，并且基于所述存储器中存储的关于多...

【专利技术属性】
技术研发人员：原田将治，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人