Method and apparatus for calibration of speech detection results provided by the invention, the method comprises the following steps: if the current frame for voice activity detection results, statistical calculation results in the buffer test value; the statistical value and the preset threshold comparison, obtained results. A method and a device for calibration of speech detection results provided by the invention, considering the characteristics of speech generally has the coherence of the detection results of the computation of the current frame after combined detection of previous frames results statistics, statistical value with a preset threshold value, judging whether the current frame detection error, improve the accuracy the rate of speech detection.
【技术实现步骤摘要】
检校语音检测结果的方法及装置
本专利技术涉及到语音识别领域,特别是涉及到一种检校语音检测结果的方法及装置。
技术介绍
近年来随着互联网技术、智能硬件的蓬勃发展,语音识别、声纹识别、声源检测等语音智能交互技术开始从实验室走向用户。由于语音识别技术是基于语音的人机交互系统最核心的技术。目前在限定条件下识别率已经达到可用的准确率。所谓限定调节通常是指用户距离麦克风较近,噪声干扰较小。而必须近距离发出语音指令这一条件限制了语音交互的便捷性。在远讲情况下,由于语音能量会快速衰减,而噪音干扰能量大致不变,会使得识别率迅速下降。另外一个影响识别准确率的因素是,语音指令到达房间墙壁多次反射之后的混响,也会造成实际应用与语音识别训练数据集的不匹配,影响识别率。噪音主要有两个来源:(1)麦克风信号采集系统自带的信道噪声,信道噪声因麦克风的敏感性而不同,麦克风敏感性越高,通常信道噪声越高;(2)不可忽略的环境噪声干扰,比如电视机、空调噪声等等。相比于噪声,混响由于产生条件更为复杂,更难抑制。并且,噪音和混响一般同时存在,使得混响抑制更加困难。201510119374.X公开了一种语音检测方法及装置,方法具体包括:将所采集的声音信号进行重叠分帧,得到对应的多个声音帧;对所得到的多个声音帧进行加窗处理;将经过加窗处理后的声音帧进行频域转换,得到各个声音帧对应的频谱;将所得到的各个声音帧对应的频谱进行倒频谱域转换,得到对应的倒频谱;计算相邻的两个声音帧的倒频谱之间的倒谱距离;当计算得出的倒谱距离大于预设的距离阈值时,对所采集的声音信号进行语音检测。该方案可以节省语音检测的时间。然而, ...
【技术保护点】
一种检校语音检测结果的方法,其特征在于,包括以下步骤:当前帧检测结果为存在语音活动,计算当前帧检测结果缓冲区内检测结果的统计值;将所述统计值与预设阈值比较,获得判断结果。
【技术特征摘要】
1.一种检校语音检测结果的方法,其特征在于,包括以下步骤:当前帧检测结果为存在语音活动,计算当前帧检测结果缓冲区内检测结果的统计值;将所述统计值与预设阈值比较,获得判断结果。2.根据权利要求1所述的检校语音检测结果的方法,其特征在于,所述当前帧检测结果为存在语音活动,计算当前帧检测结果缓冲区内检测结果的统计值之前,包括:计算所述当前帧检测结果;将所述当前帧检测结果加入上一帧检测结果缓冲区,所述上一帧检测结果缓冲区包括多个在前帧的检测结果,并更新所述上一帧检测结果缓冲区,获得所述当前帧检测结果缓冲区。3.根据权利要求2所述的检校语音检测结果的方法,其特征在于,所述计算所述当前帧检测结果,包括:计算当前帧声音信号的听觉特征,所述听觉特征包括与先验信噪比相关的第一维度参数、与后验信噪比相关的第二维度参数、与时域信号相关的第三维度参数;将所述第一维度参数、第二维度参数、第三维度参数与各自对应的听觉阈值比较,获得所述当前帧检测结果。4.根据权利要求2所述的检校语音检测结果的方法,其特征在于,所述更新所述上一帧检测结果缓冲区,获得所述当前帧检测结果缓冲区,包括:将所述当前帧检测结果加入检测结果缓冲区后,将上一帧检测结果缓冲区内最早一帧的检测结果踢出,获得所述当前帧检测结果缓冲区。5.根据权利要求1所述的检校语音检测结果的方法,其特征在于,所述统计值包括所有检测结果的总和或均值,或各检测结果按不同权重计算获得的计算结果。6.根据权利要求2所述的检校语音检测结果的方法,其特征在于,所述将所述当前帧检测结果加入上一帧检测结果缓冲区,所述上一帧检测结果...
【专利技术属性】
技术研发人员:蔡钢林,
申请(专利权)人:深圳永顺智信息科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。