语音处理方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:27774295 阅读:123 留言:0更新日期:2021-03-23 13:05
本公开实施例公开了一种语音处理方法、装置、电子设备和计算机可读存储介质。其中该语音处理方法包括:获取音频源中的音频信号;检测所述音频信号中的至少一个语音段;对所述语音段进行语音识别;响应于所述语音段被识别为语音,对所述语音段进行第一处理。通过上述方法,解决了现有技术中对语音的端点进行检测时候所可能发生误判的技术问题。

【技术实现步骤摘要】
语音处理方法、装置、电子设备及计算机可读存储介质
本公开涉及语音处理领域,尤其涉及一种语音处理方法、装置、电子设备及计算机可读存储介质。
技术介绍
作为一种人机交互的手段,语音识别技术在解放人类双手方面意义重大。但是,由于实际运行环境中存在着各种各样的背景噪声,这些噪声会严重降低语音的质量从而影响语音识别的准确率;另外,在存储或传输语音的场景下,连续的语音流在存储或传输的数据量上偏大,并且需要更多的语音处理计算工作量,因而容易降低语音应用的成功率等。因此,语音端点检测技术始终是语音处理
研究的一大热点。语音端点检测是指在噪声环境中检测语音的存在与否,并且检测出每段语音的前、后端点,通常用于语音编码、语音增强等语音处理系统中,只有检测到语音才会进行后续的处理,其余非语音音频部分不进行处理。在实际环境中,语音端点检测算法经常会受到环境噪声等干扰,容易将噪声或者人的咳嗽声等误识别为语音。这在某些应用场景下,尤其是智能音箱、智能家居等短语音命令识别场景下,上述缺陷可能会导致出现过早判断到了语音前、后端点的情况,从而导致用户真正的语音命令无本文档来自技高网...

【技术保护点】
1.一种语音处理方法,包括:/n获取音频源中的音频信号;/n检测所述音频信号中的至少一个语音段;/n对所述语音段进行语音识别;/n响应于所述语音段被识别为语音,对所述语音段进行第一处理。/n

【技术特征摘要】
1.一种语音处理方法,包括:
获取音频源中的音频信号;
检测所述音频信号中的至少一个语音段;
对所述语音段进行语音识别;
响应于所述语音段被识别为语音,对所述语音段进行第一处理。


2.如权利要求1所述的语音处理方法,其特征在于,所述检测所述音频信号中的至少一个语音段,包括:
将所述音频信号分为多个音频帧;
提取所述音频帧中的特征参数;
根据所述特征参数判断所述音频帧是否为语音帧;
将连续的语音帧合成一个语音段。


3.如权利要求2所述的语音处理方法,其特征在于,所述根据所述特征参数判断所述音频帧是否为语音帧,包括:
响应于所述特征参数大于第一阈值,判断所述音频帧为语音帧。


4.如权利要求2所述的语音处理方法,其特征在于,所述将连续的语音帧合成一个语音段,包括:
获取至少一个连续的语音帧序列;
响应于该语音帧序列的长度大于第二阈值,将所述语音帧序列合成一个语音段;
将所述语音帧序列中的第一个语音帧作为所述语音段的起点,将所述语音帧序列中的最后一个语音帧作为所述语音段的终点。


5.如权利要求1所述的语音处理方法,其特征在于,所述对所述语音段进行语音识别,包括:
提取所述语音段中的语音特征;
将所述语音特征与模板特征进行比较;
响应于所述语音特征与所述模板特征的相似度大于第三阈值,确定所述语音段为语音。


6.如权利要求5所述的语音处理方法,其特征在于,所述响应于所述语音特征与所述模板特征的相似度大于第三阈值,确定所述语音段为语音,包括:
响应于所述语音特征与所述模板特征的相似度大于第三阈值,确定所述语音段所对应的文本,其中所述文本为所述模板特征所对应的文本;
对所述文本进行语义分析得到所述语音段的语义;
响应于所述语义正确,确定所述语音段为语音。


7.如权利要求1所述的语音处理方法,其特征在于,所述对所述语音段进行语音识别,包括:
将所述语音段根据第一规则进行拆分得到多个语音子段;
对每个语音子段进行语音识别。


8.如权利要求7所述...

【专利技术属性】
技术研发人员:邱锋王彦龙苏少炜常乐
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1