语音关键词检出系统、创建用于其的词典的系统和方法技术方案

技术编号：8301235 阅读：174 留言：0更新日期：2013-02-07 05:23

本申请涉及语音关键词检出系统。其包括：输入单元，用于接收输入语音信号；特征提取单元，用于从输入语音信号提取至少一个特征；分类器单元，用于基于至少一个特征和词典将输入语音信号分类为目标关键词或者集外词；和输出单元，用于输出分类的结果。该词典包括：语法，包括目标关键词列表和用于集外词的两个标识符的至少一个序列；和词库，包括代表目标关键词列表中的一个或更多个目标关键词的音子序列的所有候选关键词的发音以及代表所述至少一个序列的发音，其中一个标识符表示第一类音子，另一个标识符表示第二类音子。第一类音子和第二类音子是基于音子的固有特征聚类的。第一类音子、第二类音子和目标关键词的音子由模型描述。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音关键词检出(spotting)系统，以及创建用于该语音关键词检出系统的词典的系统和方法。
技术介绍
语音关键词检出技术旨在检测并且识别连续的或者分割的输入语音中的预定义语音关键词。语音关键词检出技术被用于几乎所有语音识别应用中，如呼叫中心系统、语音邮件分类和按内容搜索。在实际的语音关键词检出应用中，输入语音的大多数部分不包括关键词。这些部分称为集外词(Out-Of-Vocabulary，00V)段(即，非关键词)。如果OOV段被错误地识别为关键词，则这被称为误警(false alarm, FA) 0高误警率会引起不良的用户体验。一般而言，丢弃OOV数据的方法之一是除了建立关键词模型之外，还建立用于OOV数据的适当的垃圾模型(garbage model),以区分关键词和非关键词。通常，关键词的数量是有限的。建立对于每个关键词的准确模型是相对容易的。而建立准确的垃圾模型是非常困难的，这是因为存在太多类型的00V数据。例如，关于00V数据，有静音数据、语音数据和不同类型的噪声等。建立垃圾模型的通用方法如下。(I)采用一个或更多个通用垃圾模型。例如，美国专利申请No. 20030200090 和 No. 20050256712 以及 Jay G. Wilpon 等人的 “Automatic Recognition of Keywords in Unconstrained Speech Using HiddenMarkov Models”，IEEE Trans on Assp, Vol. 38, No. 11, November, 1990,第...

【技术保护点】
一种语音关键词检出系统，包括：输入单元，用于接收输入语音信号；特征提取单元，用于从输入语音信号提取至少一个特征；分类器单元，用于基于所述至少一个特征和词典将输入语音信号分类为目标关键词或者集外词；和输出单元，用于输出分类的结果，其中，词典包括：语法，该语法包括目标关键词列表和用于集外词的两个标识符的至少一个序列；和词库，该词库包括代表目标关键词列表中的一个或更多个目标关键词的音子序列的所有候选关键词的发音以及代表用于集外词的所述两个标识符的至少一个序列的发音，所述两个标识符中的一个标识符表示第一类音子，另一个标识符表示第二类音子，第一类音子和第二类音子是基于音子的固有特征而聚类的，并且其中，第一类音子、第二类音子和用于一个或更多个目标关键词的音子分别由它们的模型描述。

【技术特征摘要】

【专利技术属性】
技术研发人员：郭莉莉，刘贺飞，亓超，
申请(专利权)人：佳能株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人