当前位置: 首页 > 专利查询>山东大学专利>正文

基于分段频点选择的语音信号盲分离方法和双耳助听系统技术方案

技术编号:20847208 阅读:22 留言:0更新日期:2019-04-13 09:14
本发明专利技术公开了一种基于分段频点选择的语音信号盲分离方法和双耳助听系统,所述方法包括:首先在低频区域和高频区域分别以混合信号的协方差矩阵行列式和混合信号的MSC为标准进行第一阶段筛选,得到初选频点集合,利用从分离矩阵中提取的归一化衰减延迟参数解决顺序不确定性和延迟参数不准确的问题;采用离群点检测方法对初选频点进行第二阶段筛选,得到终选频点集合;计算未选频点的分离矩阵;对所有频点解决幅值不确定性后完成信号的初始分离;对于未选频点,基于初始分离信号使用维纳滤波进行重新分离。本发明专利技术适用于混响的环境下,具有不限制频点选择范围,不限制麦克风之间的距离,对不同频点进行不同分离操作的特点,并且适用于双耳助听系统。

【技术实现步骤摘要】
基于分段频点选择的语音信号盲分离方法和双耳助听系统
本公开属于语音信号盲源分离
,尤其涉及一种适用于双耳助听系统的基于分段频点选择的语音信号盲分离方法。
技术介绍
盲源分离(BlindSourceSeparation,BSS)是在混合过程未知的情况下给定混合信号分离出独立源的问题。例如,鸡尾酒会问题。实际上,由于我们不知道任何有关源信号的有用信息,解决盲源分离问题变的非常艰巨。法国学者Herault和Jutten在此工作上开创了先河,提出了著名的H-J算法,即采用神经网络方法实现两个独立语音混合信号的分离。在此之后,盲源分离问题得到更多专家学者们的关注并快速发展起来,在移动通信、语音处理、生物医学信号处理等领域已得到成功应用。本文主要关注BSS在双耳助听系统中的应用,BSS可以在进行语音增强消除人声干扰的同时保持所有声源的双耳线索,在助听系统的应用方面具有非常大的潜力。由于声音传播引起的时间延迟和由声音反射产生的多径,在真实的混响环境中麦克风接收到的信号为源信号的卷积混合,但由于涉及多通道卷积运算,它们在时域中可能难以编码,简化卷积混合的一种方法是将任务变换到频域,时域卷积变为频域相乘。对于最受欢迎的频域独立成分分析(FrequencyDomainIndependentComponentAnalysis,FDICA)算法,通过在每个频点上进行ICA迭代得到分离矩阵,完成混合信号的分离。但是,该算法的计算复杂度非常高,这与助听系统低延迟和低功耗的需求相矛盾。因此,要想将FDICA算法应用到双耳助听系统中,最首要的问题是要降低算法的计算复杂度。针对这个问题,KondoKazunobu估计了FDICA算法中每一步的复杂度,并指出主要的计算复杂度是在ICA迭代这一步上。仅从信号分离的角度出发,每个频点都需要进行ICA迭代得到分离矩阵。但实际上,语音信号的能量分布特性决定了在某些能量较低的频点上进行ICA迭代对信号整体的分离性能有较小的提升。此外,在某些独立性较差的频点上进行ICA迭代可能导致整体分离性能下降,甚至ICA算法不能正常工作。因此,在不影响分离性能的条件下降低算法的复杂度可以从减少执行ICA迭代的频点数目着手。引入频点选择机制,将整个频域内的频点分为选择频点和未选频点,选择一定数量分离性能较好的频点进行ICA迭代,从而获得精确的分离矩阵,这样更有利于未选频点的分离,在减小计算复杂度的同时使整体性能得到提升。近年来,各种各样的频点选择算法被提出。例如,KondoKazunobu指出在两个麦克风两个源信号的条件下,混合信号协方差矩阵的行列式能够描述声源的数量和功率,选择行列式较大的频点进行ICA迭代得到分离矩阵。这只是从能量的角度进行频点选择。在其它论文中从独立性的角度出发,将混合信号的互信息,幅值平方相关函数(MagnitudeSquareCoherence,MSC)或者中心相关熵作为选择标准,选出标准值较小的频点进行ICA迭代。对于未选频点的分离,则是利用从选择频点的分离矩阵中提取的DOA信息或者衰减延迟参数构建未选频点的分离矩阵,从而完成分离。但是,这些算法均是针对小间距麦克风提出的,将它们直接应用到双耳助听系统中还是有问题的。考虑到助听系统中麦克风的间距约为15cm,如果我们采用16kHz的频率对语音信号进行采样,麦克风的间距超过了信号最小波长的一半。由空间采样定理可知,在高频区域会发生空间混叠,如果发生空间混叠的这些频点被选到,则无法正确提取DOA信息或延迟参数,未选频点的分离就会出现问题。有的论文中将频点选择的范围限制在不发生空间混叠的频率范围内,虽然这样避免了空间混叠所带来的问题,但对发生空间混叠的频率范围内分离性能较好的频点没有得到有效的利用,导致最终分离性能不好。此外,当前的频点选择算法均采用单一的频点选择标准,没有综合考虑不同频率区域各自的特征,分离性能较好的频点没有得到充分利用,导致最终分离性能不理想。
技术实现思路
为克服上述现有技术的不足,本公开提出了一种适用于双耳助听系统的分段频点选择语音信号盲分离方法。该方法的一个重点是对不同的频率区域使用不同的频点选择标准选择分离性能较好的频点;另一个重点是利用从分离矩阵中提取的归一化衰减和延迟参数来解决从高频区域中提取延迟参数不准确的问题;此外,我们引入了基于离群点检测的第二阶段频点选择方法,在初选频点集合中去除分离性能不好的频点,得到终选频点集合,保证了归一化衰减延迟参数的准确性;利用最终得到的归一化衰减延迟矩阵构建未选频点的分离矩阵,对所有频点的分离矩阵根据最小失真原则解决幅度不确定问题后,完成信号的初步分离。对于未选频点,引入维纳滤波后处理方法对信号进行重新分离。该方法适用于无混响和混响的环境下,不仅降低了混响的影响,提高了分离性能,而且计算复杂度也大大降低。为实现上述目的,本公开提供了如下技术方案:一种适用于双耳助听系统的基于分段频点选择的语音信号盲分离方法,包括以下步骤:对麦克风接收到的语音信号通过短时傅里叶变换变换到频域,并划分为低频区域和高频区域;进行第一阶段筛选:在低频区域和高频区域分别以混合信号的协方差矩阵行列式和混合信号的MSC为标准选择频点,将被选择的频点归入初选频点集合,未被选择的频点归入未选频点集合;对于初选频点集合,计算分离矩阵并从所述分离矩阵中提取归一化衰减和延迟参数,用于解决顺序不确定性和由空间混叠引起的高频区域估计的延迟参数不准确性;进行第二阶段筛选:根据所述归一化衰减和延迟参数,采用基于正态分布的离群点检测方法对初选频点进行筛选,得到终选频点集合,未被选择的频点归入未选频点集合;对终选频点集合和未选频点集合中所有频点的分离矩阵使用最小失真原则解决幅值不确定性,完成信号的初始分离;对于终选频点集合,初始分离信号即最终分离信号;对于未选频点集合,基于初始分离信号使用维纳滤波对混合信号进行重新分离;将所有频点上的最终分离信号利用逆短时傅里叶变换变换到时域,完成信号的分离。进一步地,所述第一阶段筛选具体包括:在能量集中的低频区域,计算该区域中每个频点上混合信号协方差矩阵的行列式;将这些频点的行列式除以最大值进行归一化处理,选择归一化后行列式值大于一定阈值的频点归入初选频点集合;在独立性较强的高频区域,计算该区域中每个频点上混合信号的MSC;选择MSC值小于一定阈值的频点归入初选频点集合。进一步地,计算分离矩阵并从所述分离矩阵中提取归一化衰减和延迟参数,用于解决顺序不确定性和由空间混叠引起的高频区域估计的延迟参数不准确性包括:对初选频点利用FastICA和量化自然梯度结合算法进行迭代计算得到分离矩阵,对分离矩阵求逆得到混合矩阵;划分发生空间混叠频点与不发生空间混叠频点;分别对发生空间混叠频点与不发生空间混叠频点进行排序,并在每个初选频点处提取归一化衰减和延迟参数。进一步地,对于不发生空间混叠的初选频点,对混合矩阵基向量进行幅值,相位和频率归一化去除不确定性,利用K-mean聚类算法完成排序后,提取每个初选频点处的归一化衰减和延迟参数;对于发生空间混叠的初选频点,利用从不发生空间混叠频点的分离矩阵中估计的归一化衰减和延迟参数构建发生空间混叠频点的模型向量;通过迭代寻优完成排序,得到每个初选频点处的本文档来自技高网
...

【技术保护点】
1.一种适用于双耳助听系统的基于分段频点选择的语音信号盲分离方法,其特征在于,包括以下步骤:对麦克风接受到的语音信号通过短时傅里叶变换变换到频域,并划分为低频区域和高频区域;进行第一阶段筛选:在低频区域和高频区域分别以混合信号的协方差矩阵行列式和混合信号的MSC为标准选择频点,将被选择的频点归入初选频点集合,未被选择的频点归入未选频点集合;对于初选频点集合,计算分离矩阵并从所述分离矩阵中提取归一化衰减和延迟参数,用于解决顺序不确定性和由空间混叠引起的高频区域估计的延迟参数不准确性;进行第二阶段筛选:根据所述归一化衰减和延迟参数,采用基于正态分布的离群点检测方法对初选频点进行筛选,得到终选频点集合,未被选择的频点归入未选频点集合;对终选频点集合和未选频点集合中所有频点的分离矩阵使用最小失真原则解决幅值不确定性,完成信号的初始分离;对于终选频点集合,初始分离信号即最终分离信号;对于未选频点集合,基于初始分离信号,使用维纳滤波对混合信号进行重新分离;将所有频点上的最终分离信号利用逆短时傅里叶变换变换到时域,完成信号的分离。

【技术特征摘要】
1.一种适用于双耳助听系统的基于分段频点选择的语音信号盲分离方法,其特征在于,包括以下步骤:对麦克风接受到的语音信号通过短时傅里叶变换变换到频域,并划分为低频区域和高频区域;进行第一阶段筛选:在低频区域和高频区域分别以混合信号的协方差矩阵行列式和混合信号的MSC为标准选择频点,将被选择的频点归入初选频点集合,未被选择的频点归入未选频点集合;对于初选频点集合,计算分离矩阵并从所述分离矩阵中提取归一化衰减和延迟参数,用于解决顺序不确定性和由空间混叠引起的高频区域估计的延迟参数不准确性;进行第二阶段筛选:根据所述归一化衰减和延迟参数,采用基于正态分布的离群点检测方法对初选频点进行筛选,得到终选频点集合,未被选择的频点归入未选频点集合;对终选频点集合和未选频点集合中所有频点的分离矩阵使用最小失真原则解决幅值不确定性,完成信号的初始分离;对于终选频点集合,初始分离信号即最终分离信号;对于未选频点集合,基于初始分离信号,使用维纳滤波对混合信号进行重新分离;将所有频点上的最终分离信号利用逆短时傅里叶变换变换到时域,完成信号的分离。2.如权利要求1所述的一种适用于双耳助听系统的基于分段频点选择的语音信号盲分离方法,其特征在于,所述第一阶段筛选具体包括:在能量集中的低频区域,计算该区域中每个频点上混合信号协方差矩阵的行列式;将这些频点的行列式除以最大值进行归一化处理,选择归一化后行列式值大于一定阈值的频点归入初选频点集合;在独立性较强的高频区域,计算该区域中每个频点上混合信号的MSC;选择MSC值小于一定阈值的频点归入初选频点集合。3.如权利要求1所述的一种适用于双耳助听系统的基于分段频点选择的语音信号盲分离方法,其特征在于,计算分离矩阵并从所述分离矩阵中提取归一化衰减和延迟参数,用于解决顺序不确定性和由空间混叠引起的高频区域估计的延迟参数不准确性包括:对初选频点利用FastICA和量化自然梯度结合算法进行迭代计算得到分离矩阵,对分离矩阵求逆得到混合矩阵;划分发生空间混叠频点与不发生空间混叠频点;分别对发生空间混叠...

【专利技术属性】
技术研发人员:魏莹刘百云
申请(专利权)人:山东大学
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1