当前位置: 首页 > 专利查询>宿迁学院专利>正文

一种应用于语音降噪的盲源分离方法技术

技术编号:37778086 阅读:37 留言:0更新日期:2023-06-09 09:08
本发明专利技术公开了盲源分离技术领域的一种应用于语音降噪的盲源分离方法,包括通过对源混合信号中的未知强干扰信号进行第一盲源分离操作,得到未知强干扰信号的参数特征,本发明专利技术包括获取目标声源所处环境的多通道音频数据;基于训练好的分离模型对所述多通道音频数据进行分离,得到单通道音频数据;将所述单通道音频数据作为目标声源的音频数据。本发明专利技术解决了多个说话人在同一时间段说话的语音重叠问题,能准确的切分出不同说话人在同一时间段说话的语音和内容,其中,多通道音频数据与二维卷积核进行卷积会得到一个二维特征,该二维特征的行为麦克风阵列的阵元数,该二维特征经过编码器的编码后,该三维矩阵可以表示第一音频特征。特征。特征。

【技术实现步骤摘要】
一种应用于语音降噪的盲源分离方法


[0001]本专利技术涉及盲源分离
,具体为一种应用于语音降噪的盲源分离方法。

技术介绍

[0002]未知强干扰下的弱信号盲源分离是一个比较困难的盲源分离问题,也一直没有比较理想的方法,近年来常用的方法是经验模态分解法。EM D(Em pi ri ca lMod eDecomposition,经验模态分解)方法,由美籍华人Huang在深入研究了瞬时频率概念的基础上,提出了IMF(IntrinsicModeFunction,本征模态函数)的概念,采用EMD能够将任意信号分解为基本模式分量。
[0003]现在的多通道分离技术是通过对波束形成算法利用麦克风之间的相位差对拾音角度外的声音(噪声,人声等)进行抑制。但是,当噪声在拾音角度内且在拾音距离内时,其他说话人的声音或者噪声不会被算法抑制,并且在一定程度上对目标说话人的声音进行干扰,导致语音识别率下降。所以,现有技术在一些场景,如银行营业厅,餐厅,大马路上进行语音交互时,对干扰抑制的不够彻底。原有的盲源分离是基于单通道语音分离的,对于空间信息的利用有限本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种应用于语音降噪的盲源分离方法,其特征在于,包括:通过对源混合信号中的未知强干扰信号进行第一盲源分离操作,得到未知强干扰信号的参数特征;获取目标声源所处环境的多通道音频数据;根据所得到未知强干扰信号的参数特征,对所述未知强干扰信号进行重组处理,得到用于抵消所述源混合信号中未知强干扰信号的强干扰抵消信号;基于训练好的分离模型对所述多通道音频数据进行分离,得到单通道音频数据;利用得到的强干扰抵消信号的参数特征和所获取的未知强干扰信号的参数特征,对所述源混合信号中的未知强干扰信号进行抵消操作,得到弱混合目标信号,并通过对所得到的弱混合目标信号进行第二盲源分离操作,得到分离后的弱目标信号;将所述单通道音频数据作为目标声源的音频数据。2.根据权利要求1所述的一种应用于语音降噪的盲源分离方法,其特征在于:所述第一盲源分离是指对所述源混合信号中对未知强干扰信号的分离处理;所述第二盲源分离是指对弱混合目标信号中各弱目标信号的分离处理。3.根据权利要求1所述的一种应用于语音降噪的盲源分离方法,其特征在于:包括获取训练用的音频数据,所述音频数据包括带有噪声的多通道音频数据和不带噪声的单通道音频数据;以所述多通道音频数据作为输入、单通道音频数据作为输出进行训练,得到所述分离模型。4.根据权利要求1所述的一种应用于语音降噪的盲源分离方法,其特征在于:所述通过对源混合信号中的未知强干扰信号进行第一盲源分离操作,得到未知强干扰信号的参数特征包括:确定用于对所述源混合...

【专利技术属性】
技术研发人员:许鹏飞贾银洁
申请(专利权)人:宿迁学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1