产生词语确认临界值的装置、方法及系统制造方法及图纸

技术编号：5964434 阅读：238 留言：0更新日期：2012-04-11 18:40

一种产生词语确认临界值的装置、方法及系统。当处理辨识目标确定之后，即可依照预期词语确认效果得到一建议临界值，除此之外，无须额外收集语料或训练模型。首先，计算至少一个语音单元所对应的一个或多个数值数据。而后，当接收至少一语音单元序列，并接收此语音单元序列中每一语音单元所对应的该或这些数值数据，并且据以组合成语音单元序列所对应的数值分布。根据一预期语词确认效果与该数值分布，产生一建议临界值输出。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种语音辨识系统，且特别涉及一种适用于语音辨识系统的词语确认临界值产生装置与方法。
技术介绍
词语确认(或称为词语验证，utterance verification)功能是语音辨识系统中不可或缺的一部分，其能够有效的拒绝集合外词汇(Out of vocabulary)所造成的辨识误动作产生。而现今的词语确认演算法在计算出一词语确认分数后，会与一临界值相比对，当分数超越临界值时代表词语确认成功，反之代表确认失败。在实际的应用中，可通过额外收集语料并针对预期的确认效果分析出最佳的临界值，而大部分的解决方案也都是针对这样的架构试图找出最好的语词确认效果。例如图IA所示，传统的语音辨识系统包括语音辨识引擎110与语词确认器120。在接收到语音指令输入时，例如收到电视、电影或是音乐播放的要求，或是非语音输入的指令，例如电灯或是游戏的操作等等，语音辨识引擎110会根据辨识指令集112与语音模型 114进行判断。在此辨识指令集112是针对电视、电影或是音乐播放要求动作的指令进行判断，而语音模型114则是提供针对这些动作的指令所建立的语音模型给语音辨识引擎110 作为判断的依据。而辨识的结果将输出到语词确认器120，经过计算后得到一个信心分数，并且将对应语音输入的信心分数与一临界值进行比较，如130所示的判断步骤。当信心分数大于临界值时，也就是语音输入的要求是属于辨识指令集112内的指令，则会做出对应的反应，例如输入电视、电影或是音乐播放等等。但若是语音输入并非属于辨识指令集112 内的指令时，例如电灯或是游戏的操作，则不会做出对应...

【技术保护点】
１．一种产生词语确认临界值的装置，该装置包括：一数值计算模块，用以计算产生至少一个语音单元所对应的一个或多个数值数据；一目标分数产生器，接收至少一语音单元序列，并从该数值计算模块中，取出该语音单元序列中每一语音单元所对应的该或这些数值数据，并且据以组合成该语音单元序列所对应的该或这些数值分布；以及一临界值决定器，连接到该目标分数产生器，用以接收该或这些数值分布，并根据一预期语词确认效果与该或这些数值分布，产生一建议临界值输出。

【技术特征摘要】

【专利技术属性】
技术研发人员：林政贤，张森嘉，邱祺添，
申请(专利权)人：财团法人工业技术研究院，
类型：发明
国别省市：71[中国|台湾]

全部详细技术资料下载我是这个专利的主人