【技术实现步骤摘要】
语音信号中的摩擦音检测
本公开涉及一种用于语音信号中的摩擦音检测的方法和系统(通常被称为“方法”)。
技术介绍
语音包含不同的发音,诸如元音、摩擦音、鼻音等。这些发音和其他属性(诸如短时功率)可以用于辅助系统(诸如降噪系统和语音识别系统)中的语音信号增强。在此类系统中通常使用被称为话音激活检测器(VAD)的检测器。话音激活检测器生成检测信号,当为二进制时,所述检测信号采取0或1来指示存在或不存在语音,反之亦然。检测信号还可以采取0至1之间的值以允许软判决,所述软判决可以指示信号中语音存在的某一度量或某一概率。例如,检测信号可以应用于语音增强系统的各个阶段,诸如回声消除器、波束形成器、噪声估计器、降噪阶段等。摩擦声音可以被定义为语音音节的“清音”部分,当通过牙齿和嘴唇对空气加压时会产生所述清音部分。诸如单词“stop”中的/s/、单词“shop”中的/sh/、单词“four”中的/f/等声音是摩擦音的示例。世界上大多数语言在其口语中都包含摩擦声音。对此类声音的检测具有挑战性,因为从技术上讲,此类声音类似于宽带形成的噪声 ...
【技术保护点】
1.一种用于检测包括干净语音信号和噪声信号的含噪语音信号中的摩擦音的方法,所述方法包括:/n利用具有第一通带范围的第一传递函数对所述含噪语音信号进行带通滤波以提供第一滤波后的含噪语音信号;/n利用具有第二通带范围的第二传递函数对所述含噪语音信号进行带通滤波,所述第二通带不同于所述第一通带以提供第二滤波后的含噪语音信号;/n对所述第一滤波后的含噪语音信号和所述第二滤波后的含噪语音信号应用最大值运算以提供表示最大摩擦音能量的频率范围的最大频谱;以及/n基于所述最大频谱来判决所述含噪语音信号中是否包含摩擦音并提供表示判决的判决信号。/n
【技术特征摘要】
20190131 DE 102019102414.51.一种用于检测包括干净语音信号和噪声信号的含噪语音信号中的摩擦音的方法,所述方法包括:
利用具有第一通带范围的第一传递函数对所述含噪语音信号进行带通滤波以提供第一滤波后的含噪语音信号;
利用具有第二通带范围的第二传递函数对所述含噪语音信号进行带通滤波,所述第二通带不同于所述第一通带以提供第二滤波后的含噪语音信号;
对所述第一滤波后的含噪语音信号和所述第二滤波后的含噪语音信号应用最大值运算以提供表示最大摩擦音能量的频率范围的最大频谱;以及
基于所述最大频谱来判决所述含噪语音信号中是否包含摩擦音并提供表示判决的判决信号。
2.如权利要求1所述的方法,其中判决包括通过利用噪声抑制传递函数滤除包含在所述最大频谱中的噪声来估计包含在所述含噪语音信号中的所述干净语音信号的频谱。
3.如权利要求2所述的方法,其还包括估计背景噪声以提供所述背景噪声的估计频谱,其中估计所述干净语音信号的所述频谱是基于所述背景噪声的所述估计频谱。
4.如权利要求3所述的方法,其中所述噪声抑制传递函数选自两个不同的主噪声抑制传递函数,所述两个主噪声抑制传递函数是基于所述背景噪声的所述估计频谱来确定的,所做的选择取决于频率是在预定义频率范围之内还是之外。
5.如权利要求4所述的方法,其中所述主噪声抑制传递函数中的一者是维纳滤波器传递函数。
6.如权利要求4或5所述的方法,其中所述主噪声抑制传递函数中的另一者是以高估权重对所述背景噪声进行加权的维纳滤波器传递函数。
7.如权利要求4至6中任一项所述的方法,其中针对摩擦音能量被预期所在的频率范围选择所述主噪声抑制传递函数中的一者,否则选择另一主噪声抑制传递函数。
8.如权利要求1至7中任一项所述的方法,其中基于包含在所述估计的干净语音频谱中的每个子带的非稳态背景噪声的总和来确定摩擦音跳变比,并且通过将所述摩擦音跳变比与预定阈值进行比较来做出是否存在摩擦音的判决。
9.如权利要求8所述的方法,其中所述摩擦音跳变比在频谱上是频带受限的。
10.如权利要求8或9所述的方法,其中基于表示过去语音片段的参数来确定所述摩擦音跳变比。
11.一种用于检测包括干净语音信号和噪声信号的含噪语音信号中的摩擦音的系统,所述系统包括连接到输入和输出的至少一个处理单元,所述系统...
【专利技术属性】
技术研发人员:V坎达德拉詹,
申请(专利权)人:哈曼贝克自动系统股份有限公司,
类型:发明
国别省市:德国;DE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。