【技术实现步骤摘要】
本专利技术涉及,用于语音识别系统中的命令词识别
技术介绍
命令词识别系统是目前语音识别系统中很重要的一个类别,广泛应用于家电、车载、智能手机以及呼叫中心的导航产品中。命令词识别系统的任务是在识别语法范围内,找出输入语音最相似的识别结果。相对于范围有限的识别语法,输入语音是无限的,当输入语音的实际内容不在识别语法范围之内,称此输入为集外词。除了集外词之外,还会有诸如背景说话声、噪声等其他的无效输入,这些无效输入送入自动语音识别系统之后,也会给出语法范围内的识别结果,相当于做出了不必要的响应,影响用户的体验。基于上述原因,自动语音识别系统需要具备较强的集外词以及无效输入的拒识能力,也即自动判断是否为集外词或者无效输入。目前的系统拒识能力主要依靠置信度判决的方案,也即自动语音识别系统不仅能给出识别结果,还应该给出该识别结果是输入语音真实内容的可信度,从而对集外词进行判决,这个过程称为置信度判决。最直接的做法是将根据声学模型和识别语法所计算得到的输入语音相对于识别结果的似然值或者是它的某种变换做为置信度,进行置信度判决。而置信度判决任务需要面对不同的输入语音, ...
【技术保护点】
一种语音识别系统中拒识能力提升方法,其特征在于实现步骤如下:(1)收集各种各样的噪声数据;然后按噪声种类进行分类,噪声种类包括背景噪声、背景音乐、关门声咳嗽声;再针对不同类别的噪声分别训练高斯混合模型(GMM);最后组合各类GMM模型为整体的吸收模型;(2)通过各种比较随意的文本训练统计语言模型,然后通过加权有限状态机(WFST)技术构建识别网络,称之为吸收网络;(3)将吸收网络和吸收模型同原始解码网络并联,形成新的解码网络;(4)将输入的原始音频经过端点检测以及特征提取模块,生成特征向量,该特征向量输入(3)中生成的解码网络中进行解码;(5)特征向量在解码网络的吸收网络、 ...
【技术特征摘要】
1.一种语音识别系统中拒识能力提升方法,其特征在于实现步骤如下: (1)收集各种各样的噪声数据;然后按噪声种类进行分类,噪声种类包括背景噪声、背景音乐、关门声咳嗽声;再针对不同类别的噪声分别训练高斯混合模型(GMM);最后组合各类GMM模型为整体的吸收模型; (2)通过各种比较随意的文本训练统计语言模型,然后通过加权有限状态机(WFST)技术构建识别网络,称之为吸收网络; (3)将吸收网络和吸收模型同原始解码网络并联,形成新的解码网络; (4)将输入的原始音频经过端点检测以及特征提取模块,生成特征向量,该特征向量输入(3)中生成的解码网络中进行解码; (5)特征向量在解码网络的吸收网络、吸收模型以及命令词网络根据Viterbi算法进行竞争,生成最终的识别结果,噪...
【专利技术属性】
技术研发人员:鹿晓亮,赵志伟,陈旭,尚丽,吴晓如,于振华,
申请(专利权)人:安徽科大讯飞信息科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。