识别装置、识别方法、生成装置和生成方法制造方法及图纸

技术编号:8594619 阅读:187 留言:0更新日期:2013-04-18 08:02
本发明专利技术涉及识别装置、识别方法、生成装置和生成方法。根据本发明专利技术的识别装置包括存储器、第一计算单元、第二计算单元和确定单元。存储器存储语句中包括的词和指示词在语句中的位置的位置信息。第一计算单元将输入语音信号与连接存储器中存储的多个词的字符串的阅读信息相比较以计算相似度。第二计算单元基于存储器中存储的词的位置信息来计算指示多个连接的词之间接近度的连接得分。确定单元基于相似度和连接得分来确定对应于语音信号的字符串。

【技术实现步骤摘要】

在此讨论的实施例针对的是识别装置、识别程序、识别方法、生成装置、生成程序和生成方法。
技术介绍
存在使用文件或网络页面中包括的文本来识别输入语音的装置。上述装置的例子包括这样一种装置,该装置计算指示输入语音的语音信号和文本中包括的词或其中词被连接的字符串之间的相似度,并且将计算的相似度超过阈值时的词或字符串判断为对应于语音信号的词或字符串。进一步,使用文本来识别输入语音的装置的另一个例子包括这样一种装置,该装置生成文本中包括的词的所有连接模式,并且将生成的连接模式登记在词典(dictionary)中,所述词典可以用来识别语音以生成词典。生成词典的装置将词典中登记的连接模式与指示输入语音的语音信号相比较以识别语音。另外,当文本中包括的词的数目为η时,生成词典的装置生成多至I至η之和的连接模式。进而,使用文本来识别输入语 音的装置的另一个例子包括通过N元语法(N-gram)来重新训练语言模型的装置。相对于从语料库训练的语言模型,重新训练语言模型的装置增加了文本中的连接词相对于其中词被连接的词串的概率。在这种情况下,重新训练语言模型的装置生成了多至文本中出现的词的数目的N次幂的模式,并且使用生成的模式增加了相对于语言模型连接的词的概率。专利文件1:日本公开专利公布第2002-41081号专利文件2 :日本公开专利公布第2002-342323号然而,根据现有技术的装置没有精确地识别语音。根据特定的例子,当没有登记在词典中作为连接模式的语音被输入时,上面提到的生成词典的装置的输入语音的识别结果的精确度低。这是因为即使文本中包括的相邻词的组合的模式包括在词典中登记的连接模式中,包括在文本中但不彼此相邻的词的组合的模式并没有包括在词典中登记的连接模式中。进一步,在上面提到的重新训练语言的装置中,由于模式被生成得多至文本中出现的词的数目的N次幂,所以将要生成的模式的信息量很大。因此,本专利技术的实施例的一方面的目标是要提供能够精确地识别语音的识别装置、识别程序、识别方法、生成装置、生成程序和生成方法。
技术实现思路
根据实施例的一方面,一种识别装置包括存储器和耦合到存储器的处理器。存储器存储语句中包括的词和指示词在语句中的位置的位置信息。处理器执行包括以下步骤的过程将输入语音信号与连接存储器中存储的多个词的字符串的阅读信息相比较以计算相似度;基于存储器中存储的词的位置信息,计算指示多个连接的词之间接近度的连接得分; 以及基于相似度和连接得分,确定对应于语音信号的字符串。附图说明图1是图示根据第一实施例的包括识别装置和生成装置的系统的配置例子的示图;图2是图示根据第一实施例的生成装置的功能配置例子的示图;图3是图示词典的例子的示图;图4是图示根据第一实施例的识别装置的功能配置例子的示图;图5是图示根据第一实施例的生成处理序列的流程图;图6是图示根据第一实施例的识别处理序列的流程图;图7是图示根据第二实施例的生成装置的功能配置例子的示图;图8是图示词典的例子的示图;图9是图示根据第二实施例的识别装置的功能配置例子的示图;图10是图示根据第二实施例的生成处理序列的流程图;图11是图示根据第二实施例的识别处理序列的流程图;图12是图示根据第三实施例的识别装置的功能例子的示图;图13是图示语言模型的例子的示图;图14是图不词词典(word dictionary)的例子的不图;图15是图示根据第三实施例的识别处理序列的流程图;图16是图示根据第四实施例的生成装置的配置例子的示图;图17是图示词类号码表的例子的示图;图18是图示词典的例子的示图;图19是图示根据第四实施例的识别装置的配置例子的示图;图20是图示概率表的例子的示图;图21是图示根据第四实施例的生成处理序列的流程图;图22是图示根据第四实施例的识别处理序列的流程图;图23是图示执行生成程序的计算机的示图;以及图24是图示执行识别程序的计算机的示图。具体实施例方式参考附图来说明本专利技术的优选实施例。然而,实施例没有限制公开的技术。因此,在实施例中,处理可以被适当地组合而没有抵触。[第一实施例]描述根据第一实施例的识别装置和生成装置。图1是图示根据第一实施例的包括识别装置和生成装置的系统的配置例子的示图。根据本实施例的系统I包括生成装置10和识别装置20。生成装置10和识别装置20经由网络30连接。生成装置10可以与识别装置20通信。在图1的例子中,在系统I中包括一个生成装置10和一个识别装置20。然而,生成装置10的数目和识别装置20的数目不限于此。例如,可以提供多个生成装置10和多个识别装置20。生成装置10生成词典,语句中包括的词被登记在所述词典中,以便与指示词在语句中的位置的位置信息相关联。例如,首先生成装置10将输入文本文件所指示的语句分割成词。语句也被称为文本。因此,生成装置10生成指示分割的词在语句中的位置的位置信息。接着,生成装置10生成词典,词被登记在所述词典中,以便与指示词在语句中的位置的位置信息相关联。生成装置10将生成的词典传送到识别装置20。识别装置20接收从生成装置10传送的词典。识别装置20将输入语音信号与连接词典中登记的多个词的字符串的阅读信息相比较以计算相似度。接着,基于词典中登记的词的位置信息,识别装置20计算指示多个连接词之间接近度的连接得分。因此,基于相似度和连接得分,识别装置20确定对应于输入语音信号的字符串。进一步,识别装置20输出确定的字符串。如上所述,识别装置20计算指示被用来计算相似度的字符串的多个词之间的接近度的连接得分。例如,识别装置20计算连接得分,以便随着被用来计算相似度的字符串的多个词彼此越接近而越高。因此,识别装置20通过不仅相加相似度而且还相加连接得分来确定对应于输入语音信号的字符串。例如,识别装置20将与通过相加相似度和连接得分而获得的值中超过阈值的值相对于的字符串确定为对应于输入语音信号的字符串。因此,即使当发声者发出具有多个连接词的字符串,所述连接词包括在语句中但在语句中没有彼此相邻,并且字符串被输入作为语音信号时,识别装置20也可以识别发声者发出的语音。因此,识别装置20允许对语音的精确识别。进一步,如上所述,生成装置10可以生成词典,所述词典允许对语音的精确识别。生成装置的功能配置的例子图2是图示根据第一实施例的生成装置的功能配置例子的示图。在图2的例子中,生成装置10包括输入单元11、输出单元12、通信单元13、存储器单元14和控制器15。输入单元11将各种信息输入到控制器15。例如,输入单元11接收用户的指令,以从别的装置获得包括与预定主题相关的语句的文本文件,并且将接收的指令输入到控制器15。输入单元11的装置的例子包括鼠标或键盘。输出单元12输出各种信息。例如,当从控制器15输入图像时,输出单元12显示图像。输出单元12的装置的例子包括阴极射线管(CRT)或液晶显示器。通信单元13是网络接口,用于与识别装置20和外部装置通信。例如,当从控制器15接收到关于将包括与预定主题相关的语句的文本文件传送到生成装置10的外部装置的指令时,通信单元13经由网络30将接收到的指令传送到外部装置。进一步,当从外部装置接收到文本文件时,通信单元13将接收到的文本文件传送到控制器15。存储器单元14存储本文档来自技高网
...

【技术保护点】
一种识别装置,包括:存储器,其存储语句中包括的词和指示所述词在所述语句中的位置的位置信息;第一计算单元,其将输入的语音信号与连接所述存储器中存储的多个词的字符串的阅读信息相比较以计算相似度;第二计算单元,其基于所述存储器中存储的词的位置信息来计算指示多个连接的词之间接近度的连接得分;以及确定单元,其基于所述相似度和所述连接得分来确定对应于所述语音信号的字符串。

【技术特征摘要】
2011.10.12 JP 2011-2253441.一种识别装置,包括 存储器,其存储语句中包括的词和指示所述词在所述语句中的位置的位置信息; 第一计算单元,其将输入的语音信号与连接所述存储器中存储的多个词的字符串的阅读信息相比较以计算相似度; 第二计算单元,其基于所述存储器中存储的词的位置信息来计算指示多个连接的词之间接近度的连接得分;以及 确定单元,其基于所述相似度和所述连接得分来确定对应于所述语音信号的字符串。2.根据权利要求1所述的识别装置,其中,所述存储器进一步存储其中多个词被耦合的词串和指示所述词串在所述语句中的位置的位置信息, 所述第一计算单元使用所述词串作为词来计算所述相似度,并且 所述第二计算单元使用所述词串作为词来计算所述连接得分。3.根据权利要求1或2所述的识别装置,其中,所述存储器进一步存储用于标识短语的标识信息,以便与所述语句中包括的短语相关联,并且 基于所述存储器中存储的词的位置信息和标识信息,所述第二计算单元针对每一个短语计算指示多个连接的词之间接近度的连接得分。4.根据权利要求1所述的识别装置,其中,所述存储器进一步存储指示第二词连接到第一词的概率的信息,并且 基于所述存储器中存储的指示第二词连接到第一词的概率的信息,所述第二计算单元进一步校正所述连接得分。5.根据权利要求2所述的识别装置,其中,所述存储器进一步存储指示第二词连接到第一词的概率的信息,并且 基于所述存储器中存储的指示第二词连接到第一词的概率的信息,所述第二计算单元进一步校正所述连接得分。6.根据权利要求3所述的识别装置,其中,所述存储器进一步存储指示第二词连接到第一词的概率的信息,并且 基于所述存储器中存储的指示第二词连接到第一词的概率的信息,所述第二计算单元进一步校正所述连接得分。7.根据权利要求1所述的识别装置,其中,所述存储器进一步存储关于多个连接的词的词类组合适合性的信息,并且 基于所述存储器中存储的关于多...

【专利技术属性】
技术研发人员:原田将治
申请(专利权)人:富士通株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1