一种语音端点检测方法技术

技术编号：21688460 阅读：13 留言：0更新日期：2019-07-24 15:18

本发明专利技术公开了一种语音端点检测方法，通过多窗谱减算法，将有噪声环境下的语音信号减噪，对语音进行增强，计算增强后语音的频域信号能量，并将该能量作为语音检测时的特征；分别计算每一帧的短时和长时能量均值作为每一帧对应的得分值和判决阈值，根据所述得分值和判决阈值的大小进行语音或非语音判决；最后，根据语义意图自适应调整说话间隙时长，判决出完整一句话的起止点位置。其具有较低的复杂度和计算量，并在复杂环境下具有很好的鲁棒性；不需要对各种环境噪声有先验知识，也能适应非平稳的各类噪声背景。

A Speech Endpoint Detection Method

全部详细技术资料下载

【技术实现步骤摘要】
一种语音端点检测方法
本专利技术涉及语音信号处理
，特别涉及一种大规模环境下的多路电话信道语音实时端点检测方法。
技术介绍
随着智能客服机器人产业的迅速发展，尤其是伴随着人工智能AI的风潮，预计在2020年我国智能客服市场将达到万亿级别。在智能客服机器人领域中对电话信道语音进行端点检测处理的应用正在不断扩展和深化。目前语音端点检测(VoiceActiveDetection，简称VAD)的主要任务是准确快速判决出待处理的语音信号有话还是无话，作为自动语音识别(AutomaticSpeechRecognition，简称ASR)系统的前置处理模块，一旦检测到话音信号，就启动自动语音语音识别系统，并进行话音数据流的传输。准确的语音端点检测将提高自动语音识别系统的利用率和减少语音处理的数据量。目前现有技术中，语音端点检测算法有基于LPC倒谱距离的算法、基于自适应模型的算法、基于倒谱分析的算法等等，但是这些方法难以在识别性能和处理速度方面达到平衡。为解决大规模环境下多路电话信道语音实时端点检测的难题，对语音端点检测算法的要求必须具备有较低的复杂度和具有较强的抗噪性能。综合分析目前已有的端点检测算法，可以将端点检测大体归结为两类：时域端点检测和频域端点检测。其中，时域端点检测大多是针对实验室安静环境的，其算法相对简单，实现比较容易，实时性较高，但是对于存在噪声的语音检测，效果明显下降；而频域端点检测在噪声环境下检测能力较强，检测精度较高，但是在较强的噪声环境下仍会有较大的漏检和误检概率，同时其算法比较复杂，实现相对较为困难。现实应用环境中，智能客服的应用场景十分广...

【技术保护点】
1.一种语音端点检测方法，其特征在于，包括如下步骤:步骤1、获取语音端点检测数据，将所述语音端点检测数据分为连续的多帧音频信号数据；步骤2、对所述语音端点检测数据进行多窗谱减，得到降噪后的频域能量数据；步骤3、将所述语音降噪后的频域数据输入到能量计算模块，得到多窗谱减输出频域能量数据；步骤4、将所述多窗谱减输出频域能量数据作为语音检测时的特征，基于所述多窗谱减输出语音片段的频域能量均值高于非语音片段对应的能量均值这一假设，分别计算每一帧的短时和长时能量均值作为每一帧对应的得分值和判决阈值，依据上述得分值和判决阈值的大小进行语音或非语音判决；步骤5、根据预先设置的断句策略，对所述语音或非语音判决进行处理，确定一句话语音的起始位置和结束位置。

【技术特征摘要】
1.一种语音端点检测方法，其特征在于，包括如下步骤:步骤1、获取语音端点检测数据，将所述语音端点检测数据分为连续的多帧音频信号数据；步骤2、对所述语音端点检测数据进行多窗谱减，得到降噪后的频域能量数据；步骤3、将所述语音降噪后的频域数据输入到能量计算模块，得到多窗谱减输出频域能量数据；步骤4、将所述多窗谱减输出频域能量数据作为语音检测时的特征，基于所述多窗谱减输出语音片段的频域能量均值高于非语音片段对应的能量均值这一假设，分别计算每一帧的短时和长时能量均值作为每一帧对应的得分值和判决阈值，依据上述得分值和判决阈值的大小进行语音或非语音判决；步骤5、根据预先设置的断句策略，对所述语音或非语音判决进行处理，确定一句话语音的起始位置和结束位置。2.根据权利要求1所述的语音端点检测方法，其特征在于，步骤2中还包括：对带噪语音x(n)进行加窗分帧处理，加窗分帧后为xi(n)，其中相邻帧之间重叠；对分帧后的信号进行快速傅里叶变换(FFT)，分别求其幅度谱|xi(k)|和相位谱θi(k)，并在相邻帧之间做平滑处理，计算平均幅度谱把分帧后的信号xi(m)进行多窗谱估计，得到多窗谱功率谱密度P(k，i)(其中，i表示第i帧，k表示第k条谱线)：P(k，i)＝PMTM[xi(m)]式中，PMTM表示进行多窗谱功率谱密度估计。3.根据权利要求2所述的语音端点检测方法，其特征在于，步骤2中还包括：对多窗谱功率谱密度估计值进行相邻帧之间的平滑处理，计算平滑功率谱...

【专利技术属性】
技术研发人员：左靖东，况鹏，范振，詹佳丽，黎宁，
申请(专利权)人：深圳市壹鸽科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人