当前位置: 首页 > 专利查询>天津大学专利>正文

基于模式聚类和子空间算法的语音欠定盲恢复方法及装置制造方法及图纸

技术编号:19483322 阅读:89 留言:0更新日期:2018-11-17 10:57
本发明专利技术公开了一种基于模式聚类和子空间算法的语音欠定盲恢复方法及装置,方法包括:对M路观测信号做加汉宁窗L点50%重叠的STFT变换,得到观测频谱;逐帧对STFT混合信号频谱做基于插值法的频谱校正操作,并对所有谐波参数对进行模式筛选;逐帧重复上一步骤,收集所有时间帧得到的SAS模式组成单源域;对单源域中的SAS模式进行数据密度聚类,得到估计的源数目及混合矩阵;根据估计出的源数目及混合矩阵,并通过子空间算法恢复源信号。装置包括:将采集到的多路观测信号经过A/D采样得到样本序列,以并行数字输入的形式输入进DSP芯片,经内部处理,得到混合矩阵的估计;借助输出驱动及其显示模块显示混合矩阵的估计值。

【技术实现步骤摘要】
基于模式聚类和子空间算法的语音欠定盲恢复方法及装置
本专利技术涉及数字信号处理
,尤其涉及一种基于模式聚类和子空间算法的语音欠定盲恢复方法及装置。
技术介绍
盲信号处理[1]作为数字信号处理的一种新的方向,专注于解决在信道未知的情况下,利用观测信号恢复源信号的问题,例如:在移动通信中,由于发射端所发出的原始信号未知,通信信号也在不断的变化中,因此,需要由接收信号去恢复原始信号。盲源分离技术广泛应用于语音信号和图像处理[2-3]、通信信道估计[4]、机械故障诊断[5]等领域。由于其输入信号未知、信道参数未知的“双盲”特性,成为众多学者研究和探讨的难点问题之一。盲源分离过程的实现通常可分为两个阶段:1)盲识别,是指通过观测信号获得一个对于混合信道的准确估计的过程;2)盲恢复阶段,是指利用盲识别的结果恢复源信号的过程[6]。依照源信号数目N和观测信号数目M的相对关系,盲源分离可区分为超定(N<M)、正定(N=M)及欠定(N>M)三种情形。盲信号处理内容大致包括:盲辨识、盲解卷积、盲信号分离。欠定观测盲信号恢复问题的困难在于:观测通道数目比源信号少,经典的独立成分分析失效;而且只是从统计分析的角度做恢复,需要耗费很长的样本。在盲识别阶段,方法主要分为2类:基于统计量的方法及基于稀疏表示的方法[2]。基于统计量的盲识别方法假定源信号相互独立。独立分量分析(IndependentComponentAnalysis,ICA)[7]最先提出该方法,但是此方法的局限性在于它只适用于超定情形。为了在欠定情形下解决盲估计问题,学者们引入四阶张量分析及矩阵瞬时对角化解决欠定盲识别问题[8]。基于稀疏表示的盲识别方法假定源信号本身呈现稀疏分布,或者可以在某一个变换域(如傅立叶变换、短时傅立叶变换、魏格纳分布等)上呈现稀疏分布[9]。主要的方法有:1)基于快速傅立叶变换的势函数法[10]:利用势函数作为目标函数,通过势函数的极值数目及位置估计源的数目及混合矩阵;2)线方向分离算法(LineOrientationSeparationTechnique,LOST)算法[11]:假定语音信号符合拉普拉斯模型,并利用最大化似然函数方法估计混合矩阵;3)非线性投影及列屏蔽(NPCM)[12]方法,利用该思想设计出目标函数,并利用粒子群算法求其目标函数的最优解,作为混合矩阵的估计等。上述方法主要存在三个缺陷:1)应用范围受到限制。ICA[7]只能解决在超定情形下的问题,无法解决欠定情形下的问题。势函数法[10]仅适用于观测数为2的盲识别问题,对于多个观测数的问题此方法失效。文献[11]提出的LOST算法无法实现对源数的估计,在实际应用中源信号数目是很重要的。2)耗费计算量较大。为了得到准确的结果,以上方法涉及到的对角化方法、特征值分解、粒子群算法等都需要耗费庞大的计算量。3)估计精度欠缺,噪声鲁棒性差。语音信号不是完全符合拉普拉斯模型的,以LOST方法[11]为代表的算法估计精度十分不稳定。由以上分析可知,现有算法无法实现估计精度高的同时降低计算复杂度。
技术实现思路
本专利技术提供了一种基于模式聚类和子空间算法的语音欠定盲恢复方法及装置,本专利技术采用先进的数据密度聚类算法,在欠定情形下得到混合矩阵和源信号数目估计,显著地提升算法的效率,详见下文描述:一种基于模式聚类和子空间算法的语音欠定盲恢复方法,所述方法包括以下步骤:对M路观测信号做加汉宁窗L点50%重叠的STFT变换,得到观测频谱;逐帧对STFT混合信号频谱做基于插值法的频谱校正操作,并对所有谐波参数对进行模式筛选;逐帧重复上一步骤,收集所有时间帧得到的SAS模式组成单源域;对单源域中的SAS模式进行数据密度聚类,得到估计的源数目及混合矩阵;根据估计出的源数目及混合矩阵,并通过子空间算法恢复源信号。具体实现时,所述对所有谐波参数对进行模式筛选包括:频率合并、有效候选模式筛选和单源成分判定。进一步地,所述频率合并具体为:其中,为第q簇的频率估计;Γq为第q簇元素数。进一步地,所述有效候选模式筛选具体为:给定一个阈值ε,对于每个观测信号都存在且唯一存在一个下标满足:则即可被当作候选有效成分,为第m路下标为的频率估计。进一步地,所述单源成分判定具体为:给定一个临界值ζ,如果中的平均投影满足下式,则判定为单源模式:其中,所述子空间算法恢复源信号需要满足的条件具体为:重叠频率最多被M-1个源信号共有。进一步地,所述根据估计出的源数目及混合矩阵,并通过子空间算法恢复源信号具体为:在每个时频点(τ0,ω0)上找到对应的ρ,求得活跃混合矩阵并通过下式求得各路源信号在时频点(τ0,ω0)上的短时傅里叶变换值:将每个时频点的所有混合信号的短时傅里叶变换值作为子空间投影的输入,对所有时频点运行子空间投影算法,得到N个源信号的谱估计再将它们进行逆STFT变换得到源信号的估计一种基于模式聚类和子空间算法的语音欠定盲恢复装置,所述装置包括:将采集到的多路观测信号x(t)经过A/D采样得到样本序列x(n),以并行数字输入的形式输入进DSP芯片;经过DSP芯片的内部处理,得到混合矩阵的估计;最后借助输出驱动及其显示模块显示混合矩阵的估计值。其中,所述DSP芯片的内部处理,得到混合矩阵的估计具体为:所述DSP芯片实现信号的STFT变换、频谱校正、模式提纯、单源模式筛选得到信号的单源域,利用基于数据密度的聚类法对单源域进行聚类,得到源数目及混合矩阵的估计;所述DSP芯片利用估计出的混合矩阵和子空间算法得到估计后的源信号频谱,并通过求逆变换得到估计信号的时域波形。本专利技术提供的技术方案的有益效果是:1、本专利技术引入基于插值算法的频谱校正技术提取谐波参数使算法精度进一步提高、算法核心得以快速实现;采用先进的数据密度聚类算法,在欠定情形下得到混合矩阵和源信号数目估计,显著地提升算法的效率;2、本专利技术提出一种基于相位的单源域判别准则,提升了对噪声的鲁棒性;允许信号间有一定程度的频率重叠,使用子空间投影算法恢复源信号,进一步提高了盲源分离的恢复精度;3、本专利技术提出了模式提纯过程,减少了计算复杂度,且精准的找出了候选有效模式,更进一步提高了性能;4、本专利技术提出了基于相位准则的单源模式的识别方法,进一步降低计算复杂度,使本方法更加稳健,应用范围更广、具备足够的抗噪声性能,且实效性好。附图说明图1为混合观测信号频谱的示意图;图2为两个人声信号经过STFT变换之后的频谱示意图;其中,(a)为女声;(b)为男声。图3为频率合并示意图;图4为本专利技术的基于数据密度和子空间算法的盲恢复方法流程图;图5为源信号和混合信号的时频分布图;其中,(a)为第一路混合信号;(b)为第二路混合信号;(c)为第三路混合信号;(d)为第一路源信号;(e)为第二路源信号;(f)为第三路源信号;(g)为第四路源信号。图6为四种算法在不同粉红噪声下的估计信噪比示意图;图7为源信号波形示意图;图8为混合信号波形示意图;图9为恢复信号波形示意图;图10为本专利技术的硬件实施图;图11为DSP内部程序流图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面对本专利技术实施方式作进一步地详细描述。针对欠定情形,本专利技术实施例提出一种基于模式聚类和子本文档来自技高网
...

【技术保护点】
1.一种基于模式聚类和子空间算法的语音欠定盲恢复方法,其特征在于,所述方法包括以下步骤:对M路观测信号做加汉宁窗L点50%重叠的STFT变换,得到观测频谱;逐帧对STFT混合信号频谱做基于插值法的频谱校正操作,并对所有谐波参数对进行模式筛选;逐帧重复上一步骤,收集所有时间帧得到的SAS模式组成单源域;对单源域中的SAS模式进行数据密度聚类,得到估计的源数目及混合矩阵;根据估计出的源数目及混合矩阵,并通过子空间算法恢复源信号。

【技术特征摘要】
1.一种基于模式聚类和子空间算法的语音欠定盲恢复方法,其特征在于,所述方法包括以下步骤:对M路观测信号做加汉宁窗L点50%重叠的STFT变换,得到观测频谱;逐帧对STFT混合信号频谱做基于插值法的频谱校正操作,并对所有谐波参数对进行模式筛选;逐帧重复上一步骤,收集所有时间帧得到的SAS模式组成单源域;对单源域中的SAS模式进行数据密度聚类,得到估计的源数目及混合矩阵;根据估计出的源数目及混合矩阵,并通过子空间算法恢复源信号。2.根据权利要求1所述的一种基于模式聚类和子空间算法的语音欠定盲恢复方法,其特征在于,所述对所有谐波参数对进行模式筛选包括:频率合并、有效候选模式筛选和单源成分判定。3.根据权利要求2所述的一种基于模式聚类和子空间算法的语音欠定盲恢复方法,其特征在于,所述频率合并具体为:其中,为第q簇的频率估计;Γq为第q簇元素数。4.根据权利要求2所述的一种基于模式聚类和子空间算法的语音欠定盲恢复方法,其特征在于,所述有效候选模式筛选具体为:给定一个阈值ε,对于每个观测信号都存在且唯一存在一个下标满足:则即可被当作候选有效成分,为第m路下标为的频率估计。5.根据权利要求2所述的一种基于模式聚类和子空间算法的语音欠定盲恢复方法,其特征在于,所述单源成分判定具体为:给定一个临界值ζ,如果中的平均投影满足下式,则判定为单源模式:6.根据权利要求1所述的一种基于模式聚类和子空间算法的语音欠定盲恢复方法,...

【专利技术属性】
技术研发人员:黄翔东徐婧文
申请(专利权)人:天津大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1