【技术实现步骤摘要】
基于噪声背景分类的语音增强方法及系统
本专利技术涉及语音信号处理
,特别是涉及基于噪声背景分类的语音增强方法及系统。
技术介绍
本部分的陈述仅仅是提到了与本专利技术相关的
技术介绍
,并不必然构成现有技术。语音是人与人之间进行信息交换最直接、最有效的工具,同时也是人与机器进行通信的工具。但是,当人与人之间进行信息交换、人与机器之间进行通信时,总是会受到噪声的影响,而且在不同的场景下,噪声的类型也是不同的,不同的噪声对有效的语音信息的影响也是不同的。例如人们在汽车内进行交谈,其噪声多为引擎噪声、喇叭声等等;在咖啡馆内噪声多为客人交谈声;在计算机机房噪声多为计算机运行的风扇声。因此同一方法在多场景进行语音增强效果往往可能不佳。因此,如何使用一种语音增强方法在不同场景时都能达到不错的效果成为了领域技术人员亟待解决的技术问题。目前各类语音增强方法大多都针对某一特定的背景噪声进行语音增强,在遇到其他类型噪声背景时,其增强效果大都一般,所以急需一种针对多种噪声场景的语音增强方法。
技术实现思路
为了 ...
【技术保护点】
1.基于噪声背景分类的语音增强方法,其特征是,包括:/n获取待处理语音信号;/n对待处理语音信号进行特征提取;/n将提取的特征,输入到训练后的分类器中,得到待处理语音的噪声背景标签;/n根据噪声背景标签,选择对应标签的训练后的生成器;/n将待处理的语音信号,输入到被选中的训练后的生成器中,得到增强后的语音信号。/n
【技术特征摘要】
1.基于噪声背景分类的语音增强方法,其特征是,包括:
获取待处理语音信号;
对待处理语音信号进行特征提取;
将提取的特征,输入到训练后的分类器中,得到待处理语音的噪声背景标签;
根据噪声背景标签,选择对应标签的训练后的生成器;
将待处理的语音信号,输入到被选中的训练后的生成器中,得到增强后的语音信号。
2.如权利要求1所述的基于噪声背景分类的语音增强方法,其特征是,对待处理语音信号进行特征提取;具体包括:
对待处理语音信号,提取梅尔频率倒谱系数特征。
3.如权利要求1所述的基于噪声背景分类的语音增强方法,其特征是,将提取的特征,输入到训练后的分类器中,得到待处理语音的噪声背景标签;其中,训练后的分类器,训练步骤包括:
构建第一训练集,所述第一训练集为已知噪声背景标签的语音信号特征;
将训练集输入到分类器中,对分类器进行训练;
当分类器的损失函数得到最小值或者训练达到迭代次数时,停止训练,得到训练后的分类器。
4.如权利要求1所述的基于噪声背景分类的语音增强方法,其特征是,根据噪声背景标签,选择对应标签的训练后的生成器;其中,训练后的生成器,具体训练步骤包括:
(1)构建第二训练集;所述第二训练集,包括:无噪声语音信号和已知噪声背景标签的带噪声语音信号;其中,已知噪声背景标签的带噪声语音信号,是通过对无噪声语音信号添加对应标签的背景噪声得到的;
(2)重复鉴别器初始化步骤、生成器初始化步骤和优化权值步骤三个步骤;
首次执行时,鉴别器初始化步骤和生成器初始化步骤,均使用正态分布的随机数对权值进行赋值;
非首次执行时,鉴别器初始化步骤和生成器初始化步骤,使用上一次优化权值步骤中的优化器优化后的权重;
(3)判断当前已训练数据个数是否大于设定值,重复进行训练,直到达到设定的训练个数;训练完成后保存优化权值步骤中最后一层权重;得到训练后的生成器。
5.如权利要求4所述的基于噪声背景分类的语音增强方法,其特征是,所述鉴别器初始化步骤;具体包括:
首次执行时,使用正态分布的随机数对权值进行赋值;将预处理后的无噪声语音输入鉴别器,鉴别器将输出为1,表示此类输入为无噪声语音;
非首次执行时,使用上一次优化权值步骤中的优化...
【专利技术属性】
技术研发人员:李晔,冯涛,张鹏,李姝,汪付强,
申请(专利权)人:山东省计算中心国家超级计算济南中心,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。