检校语音检测结果的方法及装置制造方法及图纸

技术编号：16646711 阅读：39 留言：0更新日期：2017-11-26 22:01

本发明专利技术提出的检校语音检测结果的方法及装置，其方法包括以下步骤：若当前帧检测结果为存在语音活动，则计算检测结果缓冲区内检测结果的统计值；将所述统计值与预设阈值比较，获得判断结果。本发明专利技术提出的一种检校语音检测结果的方法及装置，考虑了语音一般具有连贯性的特点，计算当前帧的检测结果后，结合前几帧的检测结果获得统计值，将统计值与预设阈值比较，判断当前帧的检测结果是否误判，提高了语音检测准确率。

Method and apparatus for calibration of speech detection results

Method and apparatus for calibration of speech detection results provided by the invention, the method comprises the following steps: if the current frame for voice activity detection results, statistical calculation results in the buffer test value; the statistical value and the preset threshold comparison, obtained results. A method and a device for calibration of speech detection results provided by the invention, considering the characteristics of speech generally has the coherence of the detection results of the computation of the current frame after combined detection of previous frames results statistics, statistical value with a preset threshold value, judging whether the current frame detection error, improve the accuracy the rate of speech detection.

全部详细技术资料下载

【技术实现步骤摘要】
检校语音检测结果的方法及装置
本专利技术涉及到语音识别领域，特别是涉及到一种检校语音检测结果的方法及装置。
技术介绍
近年来随着互联网技术、智能硬件的蓬勃发展，语音识别、声纹识别、声源检测等语音智能交互技术开始从实验室走向用户。由于语音识别技术是基于语音的人机交互系统最核心的技术。目前在限定条件下识别率已经达到可用的准确率。所谓限定调节通常是指用户距离麦克风较近，噪声干扰较小。而必须近距离发出语音指令这一条件限制了语音交互的便捷性。在远讲情况下，由于语音能量会快速衰减，而噪音干扰能量大致不变，会使得识别率迅速下降。另外一个影响识别准确率的因素是，语音指令到达房间墙壁多次反射之后的混响，也会造成实际应用与语音识别训练数据集的不匹配，影响识别率。噪音主要有两个来源：(1)麦克风信号采集系统自带的信道噪声，信道噪声因麦克风的敏感性而不同，麦克风敏感性越高，通常信道噪声越高；(2)不可忽略的环境噪声干扰，比如电视机、空调噪声等等。相比于噪声，混响由于产生条件更为复杂，更难抑制。并且，噪音和混响一般同时存在，使得混响抑制更加困难。201510119374.X公开了一种语音检...
检校语音检测结果的方法及装置

【技术保护点】
一种检校语音检测结果的方法，其特征在于，包括以下步骤：当前帧检测结果为存在语音活动，计算当前帧检测结果缓冲区内检测结果的统计值；将所述统计值与预设阈值比较，获得判断结果。

【技术特征摘要】
1.一种检校语音检测结果的方法，其特征在于，包括以下步骤：当前帧检测结果为存在语音活动，计算当前帧检测结果缓冲区内检测结果的统计值；将所述统计值与预设阈值比较，获得判断结果。2.根据权利要求1所述的检校语音检测结果的方法，其特征在于，所述当前帧检测结果为存在语音活动，计算当前帧检测结果缓冲区内检测结果的统计值之前，包括：计算所述当前帧检测结果；将所述当前帧检测结果加入上一帧检测结果缓冲区，所述上一帧检测结果缓冲区包括多个在前帧的检测结果，并更新所述上一帧检测结果缓冲区，获得所述当前帧检测结果缓冲区。3.根据权利要求2所述的检校语音检测结果的方法，其特征在于，所述计算所述当前帧检测结果，包括：计算当前帧声音信号的听觉特征，所述听觉特征包括与先验信噪比相关的第一维度参数、与后验信噪比相关的第二维度参数、与时域信号相关的第三维度参数；将所述第一维度参数、第二维度参数、第三维度参数与各自对应的听觉阈值比较，获得所述当前帧检测结果。4.根据权利要求2所述的检校语音检测结果的方法，其特征在于，所述更新所述上一帧检测结果缓冲区，获得所述当前帧检测结果缓冲区，包括：将所述当前帧检测结果加入检测结果缓冲区后，将上一帧检测结果缓冲区内最早一帧的检测结果踢出，获得所述当前帧检测结果缓冲区。5.根据权利要求1所述的检校语音检测结果的方法，其特征在于，所述统计值包括所有检测结果的总和或均值，或各检测结果按不同权重计算获得的计算结果。6.根据权利要求2所述的检校语音检测结果的方法，其特征在于，所述将所述当前帧检测结果加入上一帧检测结果缓冲区，所述上一帧检测结果...

【专利技术属性】
技术研发人员：蔡钢林，
申请(专利权)人：深圳永顺智信息科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人