【技术实现步骤摘要】
一种基于深度学习的阶梯式语音增强方法
[0001]本专利技术属于语音信号处理领域,涉及信号处理技术,特别涉及一种基于深度学习的阶梯式语音增强方法。
技术介绍
[0002]语音是人类相互传递信息最基本也是最重要的方式,语言是人类特有的能力,声音是语言传递信息最重要的工具。现今人机交互成为了未来发展的一个重要台阶,语音作为人机交互的门面现在的地位越发的重要,所以对于一个优秀的人机交互系统来说,优秀的语音前端发挥着不可替代的作用。在现实生活中,我们所处的环境时时刻刻都充斥着噪声,因此更好的背景噪声抑制方案,能更有利于人机交互,人人交互。
[0003]自动语音识别(Automatic Speech Recognition,ASR)\cite{hermus2006review}是利用信号处理和模式识别技术将语音信号转换为文本信息。当今越来越多的产品使用到了语音识别技术,在一定程度上而言语音识别是未来人机交互最重要的基石。近十多年随着科技的发展,特别是2009年以来,依托于计算机算力的深度学习和机器学习及大数据技术的飞速发展,奠 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的阶梯式语音增强方法,其特征在于:所述方法的步骤为:a)一阶合适机器感知框架的建立:步骤S1、对语音信号进行分帧及加窗处理,再进行短时傅里叶变换,将时序信号变换频域信号;步骤S2、设计启发式输入方式,将输入集中于低频区域,增强低频区的感知强度,具体表达如下公式所示:Y=(Y
i
×
signal(Y
i
,
…
,Y
n
),Y
i
,
…
,Y
n
)Y
i
表示原始语音信号中的单帧特帧,signal表示sigmoid激活;步骤S3、将激活后的特征送入一阶网络中,网络结构为残差式DNN构成,所有的激活函数均采用ReLU进行高维空间噪声分离。步骤S4、将步骤S3的结果映射为1025维增强后的线性特征,然后将该特征结合原始带噪语音的相位得到一阶增强后适合机器感知的语音信号;b)二阶适合人耳听觉感知框架建立:步...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。