【技术实现步骤摘要】
本专利技术涉及语音识别领域。
技术介绍
在语音识别系统中,数字语音信号是由静音段、噪声段及语音段混合组成的, 在这种信号中将语音和各种非语音信号区分开来,准确的确定出语音信号被称为 端点检测或语音活动性检测(Voice Activity Detection, VAD)。端点检测的正 确与否,会直接影响到语音识别系统的性能,这表现在精度和速度两方面首先, 如果移除信号中的静音和噪声段有利于系统准确提取语音的特征,提高语音识别 的准确率;其次,如果待处理的信号中包含大量的非语音部分,有效的端点检测 算法可以去除噪声段的计算,则计算量会大大减小,速度也会显著提高。端点检测的研究大致可以分为两类基于特征的方法和基于模型的方法,基 于特征的方法是指寻找对语音和噪声具有区分性的特征,按一定的规则来判断语 音段与噪声段,所用的特征主要有能量、基频、过零率、熵等。基于模型的方法 是指针对噪声与语音分别建模,用分类的方法来进行端点的检测。基于能量、过 零率等特征的方法逻辑简单,计算效率高,容易应用于实时系统,这类方法在高 信噪比的情况下效果很好,但在信噪比较低的情况下性能急剧下降 ...
【技术保护点】
一种应用于语音识别系统的端点检测方法,含有能量双门限算法和基于模型的算法,其特征在于该方法采用能量双门限算法与模型分类器判决相结合的方式,即检测-验证策略进行语音信号端点检测,在检测阶段,采用所述能量双门限算法进行能量初判;在验证阶段,先采用段过零率判决,然后再使用所述模型分类器进一步的验证,其步骤包括: 模型训练; 进行能量初判,根据能量特征确定门限值,寻找可能的语音的起始点; 模型分类器判决,对能量初判阶段和过零率判决阶段得到的语音起始点进一步的验证; 判断语音结束点和确认语音片段。
【技术特征摘要】
1、一种应用于语音识别系统的端点检测方法,含有能量双门限算法和基于模型的算法,其特征在于该方法采用能量双门限算法与模型分类器判决相结合的方式,即检测-验证策略进行语音信号端点检测,在检测阶段,采用所述能量双门限算法进行能量初判;在验证阶段,先采用段过零率判决,然后再使用所述模型分类器进一步的验证,其步骤包括模型训练;进行能量初判,根据能量特征确定门限值,寻找可能的语音的起始点;模型分类器判决,对能量初判阶段和过零率判决阶段得到的语音起始点进一步的验证;判断语音结束点和确认语音片段。2、 根据权利要求1所述的应用于语音识别系统的端点检测方法,其特征在 于所述模型训练的步骤为1) 针对端点检测的应用环境收集训练数据,对训练数据进行人工标注,分 为语音与非语音部分;2) 对训练库中的语音信号进行分帧处理,每帧提取十二维梅尔频率倒谱系 数特征及一维能量特征,使用高斯混合模型对这十三维特征进行建模,其中语音 部分数据用来训练语音模型,非语音部分数据用来训练非语音模型;3) 使用最小分类错误准则对得到的高斯混合模型进行区分性训练。3、 根据权利要求1所述的应用于语音识别系统的端点检测方法,其特征在 于所述能量初判的步骤为1) 根据背景噪声能量计算£,,,,用来代表环境噪声情况;2) 根据£、,/计算两个能量门限£,和&;3) 判断从当前位置开始的x帧内有无连续y帧的能量大于五,门限值,如果有,则记录可能的语音起始点的位置,如果没有,则重新判断;4) 判断从当前位置开始的m帧内有无连续n帧的能量大于五,门限值,i口果有,则该点为可能的语音起始点并进行下一步过零率判决,如果没有,则重新判...
【专利技术属性】
技术研发人员:高建清,胡国平,胡郁,刘庆峰,王仁华,
申请(专利权)人:安徽科大讯飞信息科技股份有限公司,
类型:发明
国别省市:34[中国|安徽]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。