一种复杂噪声场景下的实时语音段落追踪方法技术

技术编号:24462330 阅读:46 留言:0更新日期:2020-06-10 17:23
本发明专利技术公开了一种复杂噪声场景下的实时语音段落追踪方法,包含以下步骤:A、预处理;B、计算输入音频帧的离散傅里叶变换系数,C、假设前帧为噪声帧,计算初始噪声的功率,即计算傅里叶变换幅度谱的算术平均值;假设帧后的数据为带噪信号,计算带噪信号的功率;D、计算后验信噪比;E、计算先验信噪比;F、语音激活检测;G、噪声谱更新;H、计算增益系数,先利用语段之间的段落噪声估计场景中平稳噪声的频谱属性,然后设计增益函数增强语音、抑制平稳噪声。在此基础上进行浊音检测,追踪语音段落,并屏蔽语段之间的各类噪声。这样可以提高语音检测的准确率,抑制语音段叠加的噪声,以及彻底屏蔽影响听感的语段间的噪声。

A real-time speech paragraph tracking method in complex noise scene

【技术实现步骤摘要】
一种复杂噪声场景下的实时语音段落追踪方法
本专利技术涉及语音处理
,具体是一种复杂噪声场景下的实时语音段落追踪方法。
技术介绍
语音信号处理领域的工程实现要面对复杂的噪声场景,包括各种统计学特性不同的平稳噪声、瞬时噪声、时变噪声和强噪声等。使用近讲拾音设备进行语音采集、语音通信及语音识别时,背景噪声很容易被麦克风拾取,从听感方面对语音通信造成直接的影响,也会进一步影响后端语音识别等处理模块的性能。在复杂的噪声场景下,抑制混杂在语音中的稳态噪声、屏蔽语音段落间夹杂的其它类型噪声,追踪得到纯净的语音段落,能够有效地提高语音通信的听感,提高语音识别等后端处理模块的性能。统计学特性单一噪声场景下的语音追踪相对容易处理,而在复杂噪声场景下的语音段落追踪则是难点问题。
技术实现思路
本专利技术的目的在于提供一种复杂噪声场景下的实时语音段落追踪方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种复杂噪声场景下的实时语音段落追踪方法,其特征在于,包含以下步骤:>A、预处理:对输入本文档来自技高网...

【技术保护点】
1.一种复杂噪声场景下的实时语音段落追踪方法,其特征在于,包含以下步骤:/nA、预处理:对输入的音频信号分帧并加窗;取16ms数据为一帧x

【技术特征摘要】
1.一种复杂噪声场景下的实时语音段落追踪方法,其特征在于,包含以下步骤:
A、预处理:对输入的音频信号分帧并加窗;取16ms数据为一帧xi(n),其中i为帧号;
B、计算输入音频帧的离散傅里叶变换系数Yi(ωk),其中k为频谱分量的标号;
C、假设前L帧为噪声帧,计算初始噪声的功率,即计算傅里叶变换幅度谱的算术平均值;假设L帧后的数据为带噪信号,计算带噪信号的功率|Yi(ωk)|2;
D、计算后验信噪比γk=|Yi(ωk)|2/λd(k);
E、计算先验信噪比
F、语音激活检测;
G、噪声谱更新;
H、计算增益系数;
I、重建信号:计算当前帧的增强语音的幅度谱和功率谱,对增强语音的频谱做逆傅里叶变换,即可得到重建信号;
J、计算的自相关函数其中rt(τ)为延时为τ的自相关函数,N为窗长且1≤n≤N;
K、计算差分函数:计算:
L、根据下列条件进行浊音判断:计算p=1-d'(τ),p表征一帧语音中明显包含某个基频成分的概率。由于d'(τ)的取值范围为[0,1],则p的取值范围为[0,1];以pth作为阈值,大于pth的语音帧作为浊音保留;
M、清音补偿和噪声屏蔽。


2.根据权利要求1所述的一种复杂噪声场景下的实时...

【专利技术属性】
技术研发人员:马翼平张玮
申请(专利权)人:中航华东光电上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1