语言模型得分前瞻值赋值设备、语言模型得分前瞻值赋值方法和程序存储介质技术

技术编号：4948443 阅读：332 留言：0更新日期：2012-04-11 18:40

一种通过使用语言模型得分前瞻值来执行帧同步集束搜索的话音识别装置防止了正确答案假设的删减，同时抑制假设数目的增长。一种语言模型得分前瞻值赋值设备１０８被设置有定义词语音素串的词语词典２０３、赋值词语的出现容易度得分的语言模型２０２、以及平滑化语言模型得分前瞻值计算装置２０１。平滑化语言模型得分前瞻值计算装置２０１从由词语词典２０３定义的词语的音素串以及由语言模型２０２定义的语言模型得分获得词语中每个音素处的语言模型得分前瞻值，使得防止语言模型得分前瞻值集中在词语的开头。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及通过使用语言模型得分前瞻值来执行帧同步集束搜索的话音识别装置，以及适用于该话音识别装置的语言模型得分前瞻值赋值设备。
技术介绍
诸如大词汇量连续话音识别装置的高性能话音识别装置将从声学模型的知识、词语词典和语言模型所预测的各种假设(识别候选)和未知输入话音之间的声学相似度和语言相似度计算为声学模型得分和语言模型得分，并且输出最可能的假设作为识别结果。此外，为了限制装置中保持的假设的数目以消除计算量和存储器容量，每次都对声学模型得分和语言模型得分进行综合评估。然后，得分低的假设由于较小的概率而被删减(pruned)，由此防止随后的假设被采用。该方法被称为帧同步集束搜索方法(下文中简单称为集束搜索方法)。图6中示出了话音识别装置的一个示例。在图6中，作为话音识别目标的话音波形被输入到话音输入装置301，并且被传送到声学分析装置302。声学分析装置302以帧为单位计算声学特征量，并且将该声学特征量输出到距离计算装置303。距离计算装置303计算输入声学特征量和声学模型304中的每个模型之间的距离，并且根据该距离将声学模型得分输出到搜索装置305。搜索装置305通过将声学模型得分和由语言模型402 从语言模型得分前瞻值赋值设备308获得的语言模型得分相加获得要搜索的所有假设的累计得分，并且删减累计得分低的假设。对其余假设进行处理，并且从识别结果输出装置309输出最优识别结果。图7示出了词语词典403的一部分的一个示例。该示例中的词语词典403是树形结构词典。此外，在图7中，对语言模型402所给出的每个词语中的语言模型得分...

【技术保护点】
一种语言模型得分前瞻值赋值设备，包括：　　词语词典，所述词语词典定义词语的音素串；　　语言模型，所述语言模型对词语的出现容易度得分赋值；以及　　平滑化语言模型得分前瞻值计算装置，所述平滑化语言模型得分前瞻值计算装置从由所述词语词典定义的所述词语的音素串和由所述语言模型定义的所述得分获得所述词语中每个音素处的语言模型得分前瞻值，使得防止所述语言模型得分前瞻值集中在所述词语的开头。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：冈部浩司，矶谷亮辅，山端洁，花沢健，
申请(专利权)人：日本电气株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人