基于分段频点选择的语音信号盲分离方法和双耳助听系统技术方案

技术编号：20847208 阅读：22 留言：0更新日期：2019-04-13 09:14

本发明专利技术公开了一种基于分段频点选择的语音信号盲分离方法和双耳助听系统，所述方法包括：首先在低频区域和高频区域分别以混合信号的协方差矩阵行列式和混合信号的MSC为标准进行第一阶段筛选，得到初选频点集合，利用从分离矩阵中提取的归一化衰减延迟参数解决顺序不确定性和延迟参数不准确的问题；采用离群点检测方法对初选频点进行第二阶段筛选，得到终选频点集合；计算未选频点的分离矩阵；对所有频点解决幅值不确定性后完成信号的初始分离；对于未选频点，基于初始分离信号使用维纳滤波进行重新分离。本发明专利技术适用于混响的环境下，具有不限制频点选择范围，不限制麦克风之间的距离，对不同频点进行不同分离操作的特点，并且适用于双耳助听系统。

全部详细技术资料下载

【技术实现步骤摘要】
基于分段频点选择的语音信号盲分离方法和双耳助听系统
本公开属于语音信号盲源分离
，尤其涉及一种适用于双耳助听系统的基于分段频点选择的语音信号盲分离方法。
技术介绍
盲源分离(BlindSourceSeparation,BSS)是在混合过程未知的情况下给定混合信号分离出独立源的问题。例如，鸡尾酒会问题。实际上，由于我们不知道任何有关源信号的有用信息，解决盲源分离问题变的非常艰巨。法国学者Herault和Jutten在此工作上开创了先河，提出了著名的H-J算法，即采用神经网络方法实现两个独立语音混合信号的分离。在此之后，盲源分离问题得到更多专家学者们的关注并快速发展起来，在移动通信、语音处理、生物医学信号处理等领域已得到成功应用。本文主要关注BSS在双耳助听系统中的应用，BSS可以在进行语音增强消除人声干扰的同时保持所有声源的双耳线索，在助听系统的应用方面具有非常大的潜力。由于声音传播引起的时间延迟和由声音反射产生的多径，在真实的混响环境中麦克风接收到的信号为源信号的卷积混合，但由于涉及多通道卷积运算，它们在时域中可能难以编码，简化卷积混合的一种方法是将任务变换到频域，时域卷积变为频域相乘。对于最受欢迎的频域独立成分分析(FrequencyDomainIndependentComponentAnalysis,FDICA)算法，通过在每个频点上进行ICA迭代得到分离矩阵，完成混合信号的分离。但是，该算法的计算复杂度非常高，这与助听系统低延迟和低功耗的需求相矛盾。因此，要想将FDICA算法应用到双耳助听系统中，最首要的问题是要降低算法的计算复杂度。针对这个问...

【技术保护点】
1.一种适用于双耳助听系统的基于分段频点选择的语音信号盲分离方法，其特征在于，包括以下步骤：对麦克风接受到的语音信号通过短时傅里叶变换变换到频域，并划分为低频区域和高频区域；进行第一阶段筛选：在低频区域和高频区域分别以混合信号的协方差矩阵行列式和混合信号的MSC为标准选择频点，将被选择的频点归入初选频点集合，未被选择的频点归入未选频点集合；对于初选频点集合，计算分离矩阵并从所述分离矩阵中提取归一化衰减和延迟参数，用于解决顺序不确定性和由空间混叠引起的高频区域估计的延迟参数不准确性；进行第二阶段筛选：根据所述归一化衰减和延迟参数，采用基于正态分布的离群点检测方法对初选频点进行筛选，得到终选频点集合，未被选择的频点归入未选频点集合；对终选频点集合和未选频点集合中所有频点的分离矩阵使用最小失真原则解决幅值不确定性，完成信号的初始分离；对于终选频点集合，初始分离信号即最终分离信号；对于未选频点集合，基于初始分离信号，使用维纳滤波对混合信号进行重新分离；将所有频点上的最终分离信号利用逆短时傅里叶变换变换到时域，完成信号的分离。

【技术特征摘要】
1.一种适用于双耳助听系统的基于分段频点选择的语音信号盲分离方法，其特征在于，包括以下步骤：对麦克风接受到的语音信号通过短时傅里叶变换变换到频域，并划分为低频区域和高频区域；进行第一阶段筛选：在低频区域和高频区域分别以混合信号的协方差矩阵行列式和混合信号的MSC为标准选择频点，将被选择的频点归入初选频点集合，未被选择的频点归入未选频点集合；对于初选频点集合，计算分离矩阵并从所述分离矩阵中提取归一化衰减和延迟参数，用于解决顺序不确定性和由空间混叠引起的高频区域估计的延迟参数不准确性；进行第二阶段筛选：根据所述归一化衰减和延迟参数，采用基于正态分布的离群点检测方法对初选频点进行筛选，得到终选频点集合，未被选择的频点归入未选频点集合；对终选频点集合和未选频点集合中所有频点的分离矩阵使用最小失真原则解决幅值不确定性，完成信号的初始分离；对于终选频点集合，初始分离信号即最终分离信号；对于未选频点集合，基于初始分离信号，使用维纳滤波对混合信号进行重新分离；将所有频点上的最终分离信号利用逆短时傅里叶变换变换到时域，完成信号的分离。2.如权利要求1所述的一种适用于双耳助听系统的基于分段频点选择的语音信号盲分离方法，其特征在于，所述第一阶段筛选具体包括：在能量集中的低频区域，计算该区域中每个频点上混合信号协方差矩阵的行列式；将这些频点的行列式除以最大值进行归一化处理，选择归一化后行列式值大于一定阈值的频点归入初选频点集合；在独立性较强的高频区域，计算该区域中每个频点上混合信号的MSC；选择MSC值小于一定阈值的频点归入初选频点集合。3.如权利要求1所述的一种适用于双耳助听系统的基于分段频点选择的语音信号盲分离方法，其特征在于，计算分离矩阵并从所述分离矩阵中提取归一化衰减和延迟参数，用于解决顺序不确定性和由空间混叠引起的高频区域估计的延迟参数不准确性包括：对初选频点利用FastICA和量化自然梯度结合算法进行迭代计算得到分离矩阵，对分离矩阵求逆得到混合矩阵；划分发生空间混叠频点与不发生空间混叠频点；分别对发生空间混叠...

【专利技术属性】
技术研发人员：魏莹，刘百云，
申请(专利权)人：山东大学，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人