一种音频处理方法、装置、设备及可读存储介质制造方法及图纸

技术编号:22848343 阅读:20 留言:0更新日期:2019-12-17 23:09
本发明专利技术实施例提供了一种音频处理方法、装置、设备及可读存储介质,该方法包括:预先依据获取到的各语音频段误差对应的权重信息,训练语音增强模型;在接收到混合语音信号后,依据所述语音增强模型中各语音频段对应的权重偏置参数,对所述混合语音信号进行语音增强,得到目标语音信号,其中,所述权重偏置参数为依据所述权重信息训练得到的;依据所述目标语音信号进行输出。本发明专利技术实施例解决了现有语音增强模型对各语音频段一视同仁导致降噪效果差的问题,提升了语音增强效果。

An audio processing method, device, device and readable storage medium

【技术实现步骤摘要】
一种音频处理方法、装置、设备及可读存储介质
本专利技术涉及通信
,特别是涉及一种音频处理方法、一种音频处理装置、一种设备和一种可读存储介质。
技术介绍
随着通信技术的快速发展,诸如手机、平板电脑等终端越来越普及,给人们的生活、学习、工作带来了极大的便利。这些终端可以通过麦克风收集语音信号,使用语音增强技术对收集到的语音信号进行处理,以降低噪声干扰的影响。其中,语音增强是指当语音信号被各种各样的噪声干扰、甚至淹没后,从噪声背景中提取有用的语音信号,抑制、降低噪声干扰的技术。
技术实现思路
本专利技术实施例所要解决的技术问题是提供一种音频处理方法,以提升语音增强效果。相应的,本专利技术实施例还提供了一种音频处理装置、一种设备以及一种可读存储介质,用以保证上述方法的实现及应用。为了解决上述问题,本专利技术实施例公开了一种音频处理方法,包括:预先依据获取到的各语音频段误差对应的权重信息,训练语音增强模型;在接收到混合语音信号后,依据所述语音增强模型中各语音频段对应的权重偏置参数,对所述混合语音信号进行语音增强,得到目标语音信号,其中,所述权重偏置参数为依据所述权重信息训练得到的;依据所述目标语音信号进行输出。可选地,所述依据所述语音增强模型中各语音频段对应的权重偏置参数,对所述混合语音信号进行语音增强,得到目标语音信号,包括:对所述混合语音信号进行特征提取,得到带噪语音数据,所述带噪语音数据包括至少一个语音频段数据;将所述带噪语音信号输入到所述语音增强模型;通过所述语音增强模型,按照各语音频段对应的权重偏置参数,对所述带噪语音数据中的各语音频段数据进行降噪处理,得到目标用户对应的目标语音信号。可选地,所述预先依据获取到的各语音频段误差对应的权重信息,训练语音增强模型,包括:针对接收到的语音信号,获取预设的各语音频段误差对应的权重信息;依据所述各语音频段误差对应的权重信息和所述语音信号进行模型训练,得到语音增强模型。可选地,依据所述各语音频段误差对应的权重信息和所述语音信号进行模型训练,得到语音增强模型,包括:为所述语音信号添加噪声信号,生成带噪语音信号;对所述带噪语音信号进行特征提取,得到所述带噪语音数据对应的语音特征;基于所述语音特征,采用所述带噪语音信号、所述语音信号以及所述各语音频段误差对应的权重信息进行模型训练,得到语音增强模型。可选地,所述采用所述带噪语音信号、所述语音信号以及所述各语音频段误差对应的权重信息进行模型训练,得到语音增强模型,包括:确定所述带噪语音信号对应的输出估计信号;依据所述语音信号,确定所述输出估计信号对应的输出预测误差;依据所述语音频段误差对应的权重信息,对所述输出预测误差进行自适应处理,得到各语音频段对应的语音增强误差;依据所述各语音频段对应的语音增强误差,确定各语音频段对应的权重偏置参数;依据所述各语音频段对应的权重偏置参数,生成语音增强模型。可选地,所述按照各语音频段对应的权重偏置参数,对所述带噪语音数据中的各语音频段数据进行降噪处理,得到所述目标用户对应的目标语音信号,包括:基于所述各语音频段对应的权重偏置参数,确定所述带噪语音数据中每一语音频段数据对应的目标权重偏置参数;针对所述带噪语音数据中每一语音频段数据,按照所述目标权重偏置参数进行降噪处理,得到所述每一语音频段对应的降噪语音数据;依据所述语音特征和所述降噪语音数据,生成所述目标用户对应的目标语音信号。可选地,依据所述目标语音信号进行输出,包括:依据所述目标语音信号进行语音输出;和/或,对所述目标语音信号进行语音识别,生成识别结果,以及,输出所述识别结果。本专利技术实施例还公开了一种音频处理装置,包括:模型训练模块,用于预先依据获取到的各语音频段误差对应的权重信息,训练语音增强模型;语音增强模块,用于在接收到混合语音信号后,依据所述语音增强模型中各语音频段对应的权重偏置参数,对所述混合语音信号进行语音增强,得到目标语音信号;输出模块,用于依据所述目标语音信号进行输出。可选地,所述语音增强模块包括如下子模块:特征提取子模块,用于对所述混合语音信号进行特征提取,得到带噪语音数据,所述带噪语音数据包括至少一个语音频段数据;信号输入子模块,用于将所述带噪语音信号输入到所述语音增强模型;降噪处理子模块,用于通过所述语音增强模型,按照各语音频段对应的权重偏置参数,对所述带噪语音数据中的各语音频段数据进行降噪处理,得到目标用户对应的目标语音信号。可选地,所述模型训练模块包括如下子模块:权重信息获取子模块,用于针对接收到的语音信号,获取预设的各语音频段误差对应的权重信息;模型训练子模块,用于依据所述各语音频段误差对应的权重信息和所述语音信号进行模型训练,得到语音增强模型。可选地,所述模型训练子模块包括如下单元:噪声添加单元,用于为所述语音信号添加噪声信号,生成带噪语音信号;特征提取单元,用于对所述带噪语音信号进行特征提取,得到所述带噪语音数据对应的语音特征;模型训练单元,用于基于所述语音特征,采用所述带噪语音信号、所述语音信号以及所述各语音频段误差对应的权重信息进行模型训练,得到语音增强模型。可选地,所述模型训练单元包括如下子单元:估计信号确定子单元,用于确定所述带噪语音信号对应的输出估计信号;预测误差确定子单元,用于依据所述语音信号,确定所述输出估计信号对应的输出预测误差;自适应处理子单元,用于依据所述语音频段误差对应的权重信息,对所述输出预测误差进行自适应处理,得到各语音频段对应的语音增强误差;权重参数确定子单元,用于依据所述各语音频段对应的语音增强误差,确定各语音频段对应的权重偏置参数;模型生成子单元,用于依据所述各语音频段对应的权重偏置参数,生成语音增强模型。可选地,所述降噪处理子模块包括如下单元:目标权重偏置参数确定单元,用于基于所述各语音频段对应的权重偏置参数,确定所述带噪语音数据中每一语音频段数据对应的目标权重偏置参数;降噪处理单元,用于针对所述带噪语音数据中每一语音频段数据,按照所述目标权重偏置参数进行降噪处理,得到所述每一语音频段对应的降噪语音数据;目标语音信号生成单元,用于依据所述语音特征和所述降噪语音数据,生成所述目标用户对应的目标语音信号。可选地,所述输出模块包括如下子模块:语音输出子模块,用于依据所述目标语音信号进行语音输出;和/或,语音识别子模块,用于对所述目标语音信号进行语音识别,生成识别结果;输出所述识别结果。本专利技术实施例还公开了一种设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:预先依据获取到的各语音频段误差对应的权重信息,训练语音增强模型;在接收到混合语音信号后,依据所述语音增强模型中各语音频段对应的权重偏置本文档来自技高网...

【技术保护点】
1.一种音频处理方法,其特征在于,包括:/n预先依据获取到的各语音频段误差对应的权重信息,训练语音增强模型;/n在接收到混合语音信号后,依据所述语音增强模型中各语音频段对应的权重偏置参数,对所述混合语音信号进行语音增强,得到目标语音信号,其中,所述权重偏置参数为依据所述权重信息训练得到的;/n依据所述目标语音信号进行输出。/n

【技术特征摘要】
1.一种音频处理方法,其特征在于,包括:
预先依据获取到的各语音频段误差对应的权重信息,训练语音增强模型;
在接收到混合语音信号后,依据所述语音增强模型中各语音频段对应的权重偏置参数,对所述混合语音信号进行语音增强,得到目标语音信号,其中,所述权重偏置参数为依据所述权重信息训练得到的;
依据所述目标语音信号进行输出。


2.根据权利要求1所述的方法,其特征在于,所述依据所述语音增强模型中各语音频段对应的权重偏置参数,对所述混合语音信号进行语音增强,得到目标语音信号,包括:
对所述混合语音信号进行特征提取,得到带噪语音数据,所述带噪语音数据包括至少一个语音频段数据;
将所述带噪语音信号输入到所述语音增强模型;
通过所述语音增强模型,按照各语音频段对应的权重偏置参数,对所述带噪语音数据中的各语音频段数据进行降噪处理,得到目标用户对应的目标语音信号。


3.根据权利要求1或2所述的方法,其特征在于,所述预先依据获取到的各语音频段误差对应的权重信息,训练语音增强模型,包括:
针对接收到的语音信号,获取预设的各语音频段误差对应的权重信息;
依据所述各语音频段误差对应的权重信息和所述语音信号进行模型训练,得到语音增强模型。


4.根据权利要求3所述的方法,其特征在于,依据所述各语音频段误差对应的权重信息和所述语音信号进行模型训练,得到语音增强模型,包括:
为所述语音信号添加噪声信号,生成带噪语音信号;
对所述带噪语音信号进行特征提取,得到所述带噪语音数据对应的语音特征;
基于所述语音特征,采用所述带噪语音信号、所述语音信号以及所述各语音频段误差对应的权重信息进行模型训练,得到语音增强模型。


5.根据权利要求4所述的方法,其特征在于,所述采用所述带噪语音信号、所述语音信号以及所述各语音频段误差对应的权重信息进行模型训练,得到语音增强模型,包括:
确定所述带噪语音信号对应的输出估计信号;
依据所述语音信号,确定所述输出估计信号对应的输出预测误差;
依据所述语音频段误差对应的权重信息,对所述输出预测误差进行自适应处理,得到各语音频段对应的语音增强误差...

【专利技术属性】
技术研发人员:文仕学潘逸倩
申请(专利权)人:北京搜狗科技发展有限公司搜狗杭州智能科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1