一种基于谐波提取的欠定语音盲分离方法及装置制造方法及图纸

技术编号：14880878 阅读：188 留言：0更新日期：2017-03-24 03:33

本发明专利技术公开了一种基于谐波提取的欠定语音盲分离方法及装置，在盲识别阶段，对语音信号进行短时傅立叶变换，利用基于比值法频谱校正的谐波提取技术提取语音信号中的谐波成分，通过相位一致性准则对所述谐波成分做筛选；引入可估计源数的自适应K‑均值聚类法对筛选出的单源成分向量进行聚类，得到混合矩阵的估计；在盲恢复阶段，针对各路源语音信号在时频域中存在重叠的情况，采用子空间投影法对混合矩阵的估计做逆推，实现了高质量的语音信号源恢复。本发明专利技术提高了算法精度；可有效地识别出强单源成分，增强了对噪声的鲁棒性；可在源数目未知的情形下获得混合矩阵及源数目估计；并且本发明专利技术提高了适用范围，同时也可提高语音信号的恢复精度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数字信号处理
，具体涉及对于语音信号在观测数目小于源数的欠定情形下的盲分离问题。
技术介绍
盲分离是指在混合系统参数和源数目未知的情形下，仅从混合后的信号中恢复源信号的问题。盲分离方法广泛应用于语音信号处理[1]、数字通信[2]、机械故障诊断[3]等领域。根据源信号数目N及混合信号数目M的相对关系，盲分离问题可分为三种情形：超定(M>N)、正定(M＝N)、欠定(M<N)。早期盲分离的典型代表是独立分量分析[4](IndependentComponentAnalysis,ICA)，然而经典ICA方法仅适用于超定情形。求解欠定盲分离问题多分成两个阶段：盲识别(估计混合矩阵)及盲恢复(恢复源信号)[5]。后者依赖于前者的结果，故盲识别估计性能对整个盲分离性能的影响较大。盲识别方法主要有两类：基于统计量的和基于稀疏表示的。基于统计量的方法借助概率统计方法来估计混合矩阵。如文献[6]将四阶累积协方差扩展到张量域利用分层交替最小二乘算法对其进行非负库克分解以估计混合矩阵。基于稀疏表示的盲识别算法强调源信号在某个变换域内(如短时傅立叶变换ShorttimeFouriertransformation(STFT)[7]，魏格纳分布(WVD)[8]等)呈现稀疏分布。由于语音信号在时频域往往呈现稀疏特性，故相比基于统计量的盲识别方法，该类方法更适用于语音信号盲分离。稀疏表示盲识别方法又可进一步细分为两种：基于目标函数最大化的方法及基于单源域识别的方法。基于目标函数最大化的方法(如势函数法[9]，EM法[10]，非线性投影列屏蔽(NPCM)[11...
一种基于谐波提取的欠定语音盲分离方法及装置

【技术保护点】
一种基于谐波提取的欠定语音盲分离方法，其特征在于，所述欠定语音盲分离方法包括以下步骤：在盲识别阶段，对语音信号进行短时傅立叶变换，利用基于比值法频谱校正的谐波提取技术提取语音信号中的谐波成分，通过相位一致性准则对所述谐波成分做筛选；引入可估计源数的自适应K‑均值聚类法对筛选出的单源成分向量进行聚类，得到混合矩阵的估计；在盲恢复阶段，针对各路源语音信号在时频域中存在重叠的情况，采用子空间投影法对混合矩阵的估计做逆推，实现了高质量的语音信号源恢复。

【技术特征摘要】
1.一种基于谐波提取的欠定语音盲分离方法，其特征在于，所述欠定语音盲分离方法包括以下步骤：在盲识别阶段，对语音信号进行短时傅立叶变换，利用基于比值法频谱校正的谐波提取技术提取语音信号中的谐波成分，通过相位一致性准则对所述谐波成分做筛选；引入可估计源数的自适应K-均值聚类法对筛选出的单源成分向量进行聚类，得到混合矩阵的估计；在盲恢复阶段，针对各路源语音信号在时频域中存在重叠的情况，采用子空间投影法对混合矩阵的估计做逆推，实现了高质量的语音信号源恢复。2.根据权利要求1所述的一种基于谐波提取的欠定语音盲分离方法，其特征在于，所述利用基于比值法频谱校正的谐波提取技术提取语音信号中的谐波成分，通过相位一致性准则对所述谐波成分做筛选的步骤具体为：1)将频率集合进行混合，按照升序排列，得到Q个簇，对簇内频率进行合并，可得到合并后的频率序列；2)找出频率序列中的有效模式；3)将有效模式作为输入，识别有效模式中的单源模式；收集所有时间帧得到的单源模式组成单源域。3.根据权利要求1所述的一种基于谐波提取的欠定语音盲分离方法，其特征在于，所述有效模式具体为：满足给定一个小阈值ε＞0，对于每个m都存在且仅存在一个下标满足。4.根据权利要求1所述的一种基...

【专利技术属性】
技术研发人员：黄翔东，刘明卓，徐婧文，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人