【技术实现步骤摘要】
本专利技术涉及一种门限自适应的语音检测系统,尤其是涉及一种基于模糊聚类的语音检测系统。
技术介绍
语音是未来用户界面的主流。实用的语音信号处理系统必须能够在千差万别的声学环境中稳健地运行。语音检测是语音信号处理中比较重要的一部分,其稳健性将极大地影响后续的语音识别和语音编码的性能。基于门限的语音检测算法逐帧求取语音检测特征,然后把特征的数值和门限进行比较,最后将得到的帧判决结果平滑。门限对于最后的检测结果是至关重要的,过高或者过低的门限都无法给出正确的检测结果。对于能量特征来说,采用固定门限的方法是不可取的,因为语音识别系统在不同的环境下使用会有不同的背景噪声,用户录音的音量和信噪比也会不一样,因此需要在使用时在线实时的计算语音检测门限。已有的语音检测门限估计算法的研究主要集中在以下的三个方面1.基于无声段的门限估计算法,这种门限估计算法需要在识别的开始阶段录制环境噪声,然后由环境噪声的平均能量加上一个域值估计检测的高低门限。这种方法物理意义明确,能量高于无声段平均能量一定程度的即为语音,实现简单,计算量小,而且在高信噪比环境下可以得到好的检测结果。但是这种方 ...
【技术保护点】
【技术特征摘要】
1.一种门限自适应的语音检测系统,采用模糊聚类和贝叶斯信息准则,该语音检测系统包括一个语音采集装置,用于采集说话者的语音信号;一个录音缓存装置,用于将从上述语音采集装置中接收的最近录音数据缓存;一个能量特征提取装置,用于对上述录音缓存装置中存储的输入语音信号进行能量特征提取;一个模糊聚类装置,用于对上述录音缓存装置中存储的录音数据进行模糊聚类;一个贝叶斯信息准则装置,用于对经所述模糊聚类装置处理后的数据进行聚类结果后处理;一个门限估计装置,用于根据贝叶斯信息准则装置处理后的结果进行在线的检测门限计算和更新;一个逐帧比较装置,用于根据能量特征提取装置及门限估计装置的处理结果,对每帧的能量和门限进行比较,得到分帧检测的结果;一个平滑装置,用于把逐帧检测的结果经过平滑规则得到最后的基于句子的语音检测...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。