语音信号处理制造技术

技术编号:7162852 阅读:328 留言:0更新日期:2012-04-11 18:40
一种语音信号处理系统,包括用于提供表示讲话者的声学语音信号的第一信号的音频处理器(103)。EMG处理器(109)提供表示与声学语音信号同时被捕获的讲话者的肌电信号的第二信号。语音处理器(105)被布置成响应于第二信号处理第一信号以生成修改的语音信号。所述处理例如可以是波束形成、噪声补偿、或者语音编码。可以实现特别地在声学噪声环境中的改进的语音处理。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及语音信号处理,例如语音编码或语音增强。
技术介绍
语音的处理已经变得日益重要并且例如语音信号的先进编码和增强已经变得普遍。典型地,来自讲话者的声学语音信号被捕获并被转换到数字域,其中可应用先进的算法来处理该信号。例如,可将先进的语音编码或语音清晰度增强技术应用于所捕获的信号。然而,许多这样的常规处理算法的问题在于,它们并非在所有情况下都趋于最优。 例如,在许多情况下,所捕获的麦克风信号可能是扬声器产生的实际语音的次优的表示。例如这可能由于声学路径中或麦克风捕获时的失真而发生。这样的失真可以潜在地降低被捕获的语音信号的保真度。作为特定实例,可以修改语音信号的频率响应。作为另一实例,声学环境可包括大量的噪声或干扰,其导致被捕获的信号不仅仅表示语音信号,还是组合的语音和噪声/干扰信号。这样的噪声可以显著影响所得到的语音信号的处理,并且可以显著降低所生成的语音信号的质量和清晰度。例如,语音增强的传统方法在很大程度上基于将声学信号处理技术应用于输入语音信号以便改进期望的信噪比(SNR)。然而,这样的方法基本上受限于SNR和操作环境条件,因此不可能总是提供好的性能。在其它领域,已提出在靠近颂以下的喉和舌下区域的区域中测量表示讲话者发声系统的运动的信号。已经提出,这种对讲话者的发声系统的要素的测量结果可以被转换成语音,并且因此可以被用来为语音障碍的人生成语音信号,从而允许它们使用语音来交流。 这些方法是基于如下基本原理这样的信号在人类语音系统的各子系统中产生,之后在包括嘴、唇、舌和鼻腔的最终子系统中最终转换成声学信号。然而,该方法在其功效方面是有限的,并且不能单独地完美再现语音。在美国专利US57^694中,已提出将电磁波导向发音器官,如讲话者的喉。传感器随后检测由发音器官散射的电磁辐射,并且该信号与同时记录的声学语音信息一起用于执行对声学语音的完整数学编码。然而,所描述的方法实现起来趋于复杂和麻烦,并且要求不实用的和典型地昂贵的设备来测量电磁信号。此外,电磁信号的测量趋于相对不精确,并且因此所得到的语音编码趋于次优,特别地所得到的编码的语音质量趋于次优。因此,改进的语音信号处理将是有利的,并且特别地,允许灵活性增加、复杂性降低、用户便利性增加、质量改进、成本降低和/或性能改进的系统将是有利的。
技术实现思路
因此,本专利技术设法优选地单独地或以任意组合方式缓解、减轻或消除上述缺点中的一个或多个。按照本专利技术的一方面,提供一种语音信号处理系统,其包括第一装置,用于提供表示讲话者的声学语音信号的第一信号;第二装置,用于提供表示与所述声学语音信号同时被捕获的讲话者的肌电信号的第二信号;以及处理装置,用于响应于第二信号处理第一信号以生成修改的语音信号。本专利技术可以提供改进的语音处理系统。特别地,无声(sub vocal)信号可以用来增强语音处理同时保持低的复杂性和/或成本。此外,在许多实施例中,对用户而言可以减少不便。肌电信号的使用可以提供不可方便地用于其它类型的无声信号的信息。例如,肌电信号可以允许语音相关的数据在讲话实际开始之前被检测到。在许多情况下,本专利技术可以提供改进的语音质量,并且可以另外地或可替换地降低成本和/或复杂性和/或资源要求。第一和第二信号可以同步或可以不同步(例如一个可以相对于另一个被延迟),但是可以表示同时的声学语音信号和肌电信号。特别地,第一信号可以表示第一时间间隔内的声学语音信号,而第二信号可以表示第二时间间隔内的肌电信号,其中第一时间间隔和第二时间间隔是重叠的时间间隔。第一信号和第二信号可以特别地提供在至少一个时间间隔内来自讲话者的相同语音的信息。按照本专利技术的可选特征,语音信号处理系统还包括肌电传感器,其被设置成响应于对讲话者皮肤表面传导性的测量生成肌电信号。这可以提供肌电信号的确定,其提供高质量的第二信号同时为用户提供友好的且侵扰程度较低的传感器操作。按照本专利技术的可选特征,处理装置被设置成响应于第二信号执行语音活动检测, 并且该处理装置被设置成响应于所述语音活动检测来修改第一信号的处理。在许多实施例中,这可以提供改进的和/或便利的语音操作。特别地,在许多情况下,它可以例如在噪声环境中允许改进的检测和与语音活动相关的处理。作为另一实例,它可以允许在多个讲话者正在同时讲话的环境中针对单个讲话者的语音检测。语音活动检测可以例如是语音是否存在的简单二元检测。按照本专利技术的可选特征,语音活动检测是预先的语音活动检测。在许多实施例中,这可以提供改进的和/或便利的语音操作。事实上,该方法可以允许语音活动在讲话实际开始之前被检测到,从而允许自适应运算的预先初始化和更快的收敛。按照本专利技术的可选特征,所述处理包括第一信号的自适应处理,并且处理装置被设置成仅在语音活动检测满足标准时调适所述自适应处理。本专利技术可以允许自适应语音处理的改进的调适,并且可以特别地允许基于对何时应执行调适的改进的检测的改进的调适。特别地,一些自适应处理仅在存在语音时被有利地调适,而其它自适应处理仅在不存在语音时被有利地调适。因此,在许多情形中,可以通过选择何时基于肌电信号来调适所述自适应处理来实现改进的调适以及进而实现所得到的语音处理和质量。例如对于某些应用,所述标准可能需要检测语音活动,而对于其它应用,可能不需要检测语音活动。按照本专利技术的可选特征,所述自适应处理包括自适应音频波束形成处理。在某些实施例中,本专利技术可以提供改进的音频波束形成。特别地,可以实现更精确的调适和波束形成跟踪。例如,所述调适可以更集中在用户正在讲话的时间间隔上。按照本专利技术的可选特征,所述自适应处理包括自适应噪声补偿处理。在某些实施例中,本专利技术可以提供改进的噪声补偿处理。特别地,可以例如通过改进的将噪声补偿调适集中在用户未讲话的时间间隔上,实现噪声补偿的更精确的调适。噪声补偿处理例如可以是噪声抑制处理或干扰消除/减少处理。按照本专利技术的可选特征,所述处理装置被设置成响应于第二信号确定语音特性, 以及响应于所述语音特性修改第一信号的处理。在许多实施例中,这可以提供改进的语音处理。在许多实施例中,它可以提供语音处理对于语音的特定属性的改进的调适。此外,在许多情况下,肌电信号可以允许在接收到语音信号之前对语音处理进行调适。按照本专利技术的可选特征,语音特性是一种浊音化(voicing)特性,并且第一信号的处理取决于浊音化特性所指示的当前的浊音化程度而变化。这可以允许对语音处理特别有利的调适。特别地,与不同音素相关联的特性可以显著变化(例如浊音(voiced)信号和清音(unvoiced)信号),因此基于肌电信号的发声特性的改进的检测可以导致充分改进的语音处理及所得到的语音质量。按照本专利技术的可选特征,所修改的语音信号是编码的语音信号,并且所述处理装置被设置成响应于语音特性而选择用于编码第一信号的一组编码参数。这可以允许改进语音信号的改进的编码。例如,所述编码可以被调适以反映语音信号主要是正弦信号还是类似噪声的信号,从而允许编码被调适以反映该特性。按照本专利技术的可选特征,所修改的语音信号是编码的语音信号,第一信号的处理包括第一信号的语音编码。在某些实施例中,本专利技术可以提供改进的语音编码。按照本专利技术的可选特征,所述系统包括包含第一和第二装置的第一设备;以及远离第一设备并包括本文档来自技高网
...

【技术保护点】
1. 一种语音信号处理系统,包括:第一装置(103),用于提供表示讲话者的声学语音信号的第一信号;第二装置(109),用于提供表示与所述声学语音信号同时被捕获的讲话者的肌电信号的第二信号;以及处理装置(105),用于响应于第二信号处理第一信号以生成修改的语音信号。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:S斯里尼瓦桑
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:发明
国别省市:NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1