【技术实现步骤摘要】
【国外来华专利技术】使用线索的聚类的语音增强
技术介绍
[0001]语音增强模块的性能取决于滤除所有干扰信号、仅留下期望的语音信号的能力。干扰信号可能是例如其他说话者、来自空调的噪声、音乐、马达噪声(例如在汽车或飞机中)和也称为“鸡尾酒派对噪声”的大的人群噪声。语音增强模块的性能通常通过其改进语音噪声比(SNR)或语音干扰比(SIR)的能力来衡量,语音噪声比和语音干扰比分别反映期望的语音信号的功率与噪声的总功率的比和期望的语音信号的功率与其他干扰信号的总功率的比(通常以dB为单位)。
[0002]越来越需要在混响环境中执行语音增强。
技术实现思路
[0003]可以提供用于语音增强的方法,所述方法可以包括:接收或生成声音样本,所述声音样本表示在给定的时间段期间由麦克风(microphone,传声器)阵列接收的声音信号;对所述声音样本进行频率变换,以提供经频率变换的样本;将所述经频率变换的样本根据说话者进行聚类,以提供说话者相关的聚类,其中所述聚类可以基于(i)与接收的声音信号相关的空间线索和(ii)与所述说话者相关的声学线索;为所述说话者中的每个说 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于语音增强的方法,所述方法包括:接收或生成声音样本,所述声音样本表示在给定的时间段期间由麦克风阵列接收的声音信号;对所述声音样本进行频率变换,以提供经频率变换的样本;将所述经频率变换的样本根据说话者进行聚类,以提供说话者相关的聚类,其中所述聚类基于(i)与接收的声音信号相关的空间线索和(ii)与所述说话者相关的声学线索;为所述说话者中的每个说话者确定相对传递函数,以提供说话者相关的相对传递函数;在所述说话者相关的相对传递函数上应用多输入多输出(MIMO)波束成形操作,以提供波束成形的信号;对所述波束成形的信号进行逆频率变换,以提供语音信号。2.根据权利要求1所述的方法,包括生成与所述说话者相关的声学线索。3.根据权利要求2所述的方法,其中所述声学线索的生成包括:在所述声音样本中搜索关键字;以及从所述关键字提取所述声学线索。4.根据权利要求3所述的方法,还包括提取与所述关键字相关的空间线索。5.根据权利要求4所述的方法,包括使用与所述关键字相关的空间线索作为聚类种子。6.根据权利要求2所述的方法,其中所述声学线索包括音高频率、音高强度、一个或多个音高频率谐波以及所述一个或多个音高频率谐波的强度。7.根据权利要求5所述的方法,包括将可靠性属性与每个音高相关联并且当所述音高的可靠性下降到预定义的阈值以下时确定与所述音高相关联的说话者是沉默的。8.根据权利要求1所述的方法,其中所述聚类包括处理所述经频率变换的样本,以提供所述声学线索和所述空间线索;使用所述声学线索追踪说话者的随时间变化的状态;将所述经频率变换的信号的每个频率分量的所述空间线索分割成组;并且将与当前活跃的说话者相关的声学线索分配给每组经频率变换的信号。9.根据权利要求8所述的方法,其中所述分配包括对于每组经频率变换的信号计算时间频率图的等频率行的元素与属于所述时间频率图的其他行并且与该组经频率变换的信号相关的元素之间的互相关。10.根据权利要求8所述的方法,其中所述追踪包括应用扩展卡尔曼滤波器。11.根据权利要求8所述的方法,其中所述追踪包括应用多假设追踪。12.根据权利要求8所述的方法,其中所述追踪包括应用粒子滤波器。13.根据权利要求8所述的方法,其中所述分割包括将与单个时间帧相关的单个频率分量分配给单个说话者。14.根据权利要求8所述的方法,包括监测语音速度、语音强度和情感表达中的至少一个监测的声学特征。15.根据权利要求14所述的方法,包括将所述至少一个监测的声学特征馈送到扩展卡尔曼滤波器。16.根据权利要求1所述的方法,其中所述经频率变换的样本被布置在多个向量中,所述麦克风阵列中的每个麦克风有一个向量;其中所述方法包括通过对所述多个向量进行加
权平均来计算中间向量;以及通过忽略所述中间向量的具有低于预定义的阈值的值的元素来搜索声学线索候选。17.根据权利要求16所述的方法,包括将所述预定义的阈值确定为噪声的标准偏差的三倍。18.一种非暂时性计算机可读介质,其存储指令,所述指令一旦被计算机化系统执行就导致所述计算机化系统:接收或生成声音样本,所述声音样本表示在给定的时间段期间由麦克风阵列接收的声音信号;对所述声音样本进行频率变换,以提供经频率变换的样本;将所述经频率变换的样本根据说话者进行聚类,以提供说话者相关的聚类,其中所述聚类基于(i)与接收的声音信号相关的空间线索和(ii)与所述说话者相关的声学线索;为所述说话者中的每个说话者确定相对传递函数,以提供说话者相关的相对传递函数;在所述说话者相关的相对传递函数上应用多输入多输出(MIMO)波束成形操作,以提供波束成形的信号;对所述波束成形的信号进行逆频率变换,以提供语音信号...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。