单通道信号双路分离方法、装置、存储介质及处理器制造方法及图纸

技术编号:22295881 阅读:55 留言:0更新日期:2019-10-15 04:59
本发明专利技术公开了一种单通道信号双路分离方法、装置、存储介质及处理器。其中,方法包括步骤:建立一多路神经网络学习模型,该模型包括目标映射路、时频掩蔽路和全连接层,目标映射路采用目标映射方法对单通道信号数据进行分离,并行的,时频掩蔽路采用时频掩蔽方法对单通道信号数据进行分离;目标映射路和时频掩蔽路分离后输出的数据通过全连接层汇合,并整理为目标数据的规格,进而输出估计的目标信号数据特征。本发明专利技术兼容了时频掩蔽方法和目标映射方法各自的优点,并在一定程度上弥补了其缺陷,在同样不考虑信号数据相位的情况下,模型泛化性能较好。

Two-way Separation Method, Device, Storage Media and Processor for Single Channel Signal

【技术实现步骤摘要】
单通道信号双路分离方法、装置、存储介质及处理器
本专利技术属于盲源分离(BlindSourceSeparation,BSS)研究领域,早期主要应用于信号处理领域,又名为盲信号分离,特别涉及一种单通道信号双路分离方法、装置、存储介质及处理器。
技术介绍
目前大多是将信号数据的分离过程看作一个监督性学习问题,进而利用深度学习网络模型实现。基于深度学习的盲源分离一般性框架主要分为“深度学习模型训练”和“单通道数据分离”两个阶段:(1)训练阶段:利用深度学习模型提取训练数据的特征,学习未分离的源信号数据和已由人工分离的标签信号数据的非线性关系;(2)分离阶段:把训练好的模型用于混合信号数据分离,最后把分离出的信号数据重新整合塑造成完整的信号数据。采用深度学习方法的关键是计算目标的设计,这会直接反映到代价函数的设置,对深度学习模型的各项性能有重大的影响。目前,对于单通道信号数据分离任务,主流的计算目标主要有目标映射和时频掩蔽:(1)目标映射:在训练过程中直接学习源数据与标签数据的映射关系;在测试和验证过程中输出估计的目标数据,是监督性学习问题最直接、最广泛的计算目标设置方法,其代价函数设置为:其中yi为所需的目标信号数据,xi是单通道带噪混合信号数据,是通过深度学习模型得到的目标信号数据的估计。进行单通道信号数据分离时,该方法使深度学习模型直接学习目标信号数据和单通道带噪信号数据之间的映射关系。其主要特点有:①不需要先验知识;②不需要经过复杂的数据处理、特征提取过程;③不存在物理理论上的缺陷。但单通道带噪混合信号数据具有噪声随机性和不可预测性,与目标信号数据的关系不直接、不明确,这类方法的主要缺点是:①模型估计难度大;②模型训练速度缓慢;③模型泛化效果差。(2)时频掩弊:是假定目标信号数据和单通道带噪混合信号数据在不同时频上存在着一定的比例关系,即时频掩蔽,在训练过程中通过特殊的数据处理、特征提取过程,学习源数据与标签数据的时频掩蔽关系;在测试和验证过程中输出估计的时频掩蔽比例关系,进而得到估计的目标信号数据。进行单通道信号数据分离时,该方法使深度学习模型分析目标信号数据和单通道带噪信号数据在不同时频上存在的比例关系,对于语音信号数据分离具有较好的表现效果。其主要特点有:①模型估计难度较小;②模型训练速度较快;③模型泛化效果较好。但在真实环境中,这类方法的主要缺点是:目标信号数据难以预测范围,并且经常出现因目标信号数据和噪声信号数据的相位不相等而导致的物理干涉现象。因此,针对上述问题,需要提供一种基于深度学习的单通道信号双路分离方法、装置,以及实现上述方法或者应用上述装置的存储介质及处理器。
技术实现思路
本专利技术的主要目的在于克服现有技术的缺点与不足,借鉴多路神经网络思想、时频掩蔽方法以及目标映射方法,提供一种基于深度学习的单通道信号双路分离方法、装置,其兼容了时频掩蔽方法和目标映射方法各自的优点,并在一定程度上弥补了其缺陷,具有收敛速度快、分离结果准确的优点。本专利技术的另一个目的在于提供一种存储介质,其上存储有计算机程序,该程序运行时执行所述单通道信号双路分离方法。本专利技术的另一个目的在于提供一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述单通道信号双路分离方法。本专利技术的目的通过以下的技术方案实现:单通道信号双路分离方法,包括步骤:建立一多路神经网络学习模型,该模型包括目标映射路、时频掩蔽路和全连接层,目标映射路采用目标映射方法对单通道信号数据进行分离,并行的,时频掩蔽路采用时频掩蔽方法对单通道信号数据进行分离;目标映射路和时频掩蔽路分离后输出的数据通过全连接层汇合,并整理为目标数据的规格,进而输出估计的目标信号数据特征。优选的,目标映射路采用目标映射方法对单通道信号数据进行分离时,在目标映射深度学习模型之后设计连接一个映射层,映射层采用relu族激活函数模拟目标映射方法,建立目标映射深度学习模型输出的信号数据与单通道带噪混合信号数据之间的映射关系,得到该目标映射路估计的目标信号数据。优选的,时频掩蔽路采用时频掩蔽方法对单通道信号数据进行分离时,在时频掩蔽深度学习模型之后设计连接一个掩蔽层,时频掩蔽深度学习模型对单通道带噪混合信号数据进行分离,掩蔽层采用sigmoid激活函数模拟时频掩蔽方法,建立时频掩蔽深度学习模型输出的信号数据与单通道带噪混合信号数据之间的时频掩蔽比例更进一步的,为平衡两路对于整体模型的权重和输出数据的分布差异,预先在时频掩蔽路模拟输出目标信号数据特征的估计,即以进行处理,xi表示单通道带噪混合信号数据,然后与目标映射路在全连接层汇合。作为一种优选方式,目标映射深度学习模型、时频掩蔽深度学习模型均采用卷积神经网络CNN实现。作为一种优选方式,目标映射深度学习模型、时频掩蔽深度学习模型均采用长短时记忆循环神经网络LSTM实现。作为一种优选方式,目标映射深度学习模型、时频掩蔽深度学习模型均采用双向长短时记忆循环神经网络BLSTM实现。单通道信号双路分离装置,包括:一多路神经网络学习模型模块,该模块包括目标映射路、时频掩蔽路和全连接层,其中:目标映射路,用于采用目标映射方法对单通道信号数据进行分离,时频掩蔽路,用于采用时频掩蔽方法对单通道信号数据进行分离;全连接层汇合模块,用于将目标映射路和时频掩蔽路分离后输出的数据汇合,并整理为目标数据的规格,进而输出估计的目标信号数据特征。优选的,所述目标映射路包括目标映射深度学习模型和映射层,映射层采用relu族激活函数模拟目标映射方法,建立目标映射深度学习模型输出的信号数据与单通道带噪混合信号数据之间的映射关系,得到该目标映射路估计的目标信号数据。优选的,所述时频掩蔽路包括时频掩蔽深度学习模型和掩蔽层,掩蔽层采用sigmoid激活函数模拟时频掩蔽方法,建立时频掩蔽深度学习模型输出的信号数据与单通道带噪混合信号数据之间的时频掩蔽比例预先在时频掩蔽路模拟输出目标信号数据特征的估计,即以进行处理,xi表示单通道带噪混合信号数据,然后与目标映射路在全连接层汇合。本专利技术针对单通道信号,通过并行采用目标映射方法和时频掩蔽方法分别进行分离,然后对分离后输出的数据通过全连接层汇合,总体训练收敛速度介乎于时频掩蔽方法和目标映射方法之间,比时频掩蔽方法慢,但比目标映射方法快,不存在时频掩蔽方法的理论缺陷,性能表现均比时频掩蔽方法和目标映射方法要好;时频掩蔽路扮演着“加速器”的角色,而目标映射路则扮演着“提升器”的角色。在同样不考虑信号数据相位的情况下,模型泛化性能较好。附图说明图1是本专利技术方法的流程图。图2是本专利技术方法全连接层汇合处的处理过程示意图。图3是对双路汇合处理的全连接操作看作半连接操作的示意图。图4是实施例1中深度学习模型均采用CNN实现的流程图。图5是实施例1中深度学习模型均采用LSTM实现的流程图。图6是实施例1中深度学习模型均采用BLSTM实现的流程图。具体实施方式下面结合实施例及附图对本专利技术作进一步详细的描述,但本专利技术的实施方式不限于此。实施例1针对单通道信号的数据分离,现有技术中分别采用目标映射和时频掩蔽均具有各自的缺陷,为此,本专利技术借鉴多路神经网络思想,提出一种综合上述两种方法的单通道信号双路分离方法。多路神经网络的主要特点在于不存在本文档来自技高网
...

【技术保护点】
1.单通道信号双路分离方法,其特征在于,包括步骤:建立一多路神经网络学习模型,该模型包括目标映射路、时频掩蔽路和全连接层,目标映射路采用目标映射方法对单通道信号数据进行分离,并行的,时频掩蔽路采用时频掩蔽方法对单通道信号数据进行分离;目标映射路和时频掩蔽路分离后输出的数据通过全连接层汇合,并整理为目标数据的规格,进而输出估计的目标信号数据特征。

【技术特征摘要】
1.单通道信号双路分离方法,其特征在于,包括步骤:建立一多路神经网络学习模型,该模型包括目标映射路、时频掩蔽路和全连接层,目标映射路采用目标映射方法对单通道信号数据进行分离,并行的,时频掩蔽路采用时频掩蔽方法对单通道信号数据进行分离;目标映射路和时频掩蔽路分离后输出的数据通过全连接层汇合,并整理为目标数据的规格,进而输出估计的目标信号数据特征。2.根据权利要求1所述的单通道信号双路分离方法,其特征在于,目标映射路采用目标映射方法对单通道信号数据进行分离时,在目标映射深度学习模型之后设计连接一个映射层,映射层采用relu族激活函数模拟目标映射方法,建立目标映射深度学习模型输出的信号数据与单通道带噪混合信号数据之间的映射关系,得到该目标映射路估计的目标信号数据。3.根据权利要求1所述的单通道信号双路分离方法,其特征在于,时频掩蔽路采用时频掩蔽方法对单通道信号数据进行分离时,在时频掩蔽深度学习模型之后设计连接一个掩蔽层,时频掩蔽深度学习模型对单通道带噪混合信号数据进行分离,掩蔽层采用sigmoid激活函数模拟时频掩蔽方法,建立时频掩蔽深度学习模型输出的信号数据与单通道带噪混合信号数据之间的时频掩蔽比例预先在时频掩蔽路模拟输出目标信号数据特征的估计,即以进行处理,xi表示单通道带噪混合信号数据,然后与目标映射路在全连接层汇合。4.根据权利要求1所述的单通道信号双路分离方法,其特征在于,目标映射深度学习模型、时频掩蔽深度学习模型均采用卷积神经网络CNN实现。5.根据权利要求1所述的单通道信号双路分离方法,其特征在于,目标映射深度学习模型、时频掩蔽深度学习模型均采...

【专利技术属性】
技术研发人员:聂瑞华高卓君梁志浩
申请(专利权)人:华南师范大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1