在掩蔽语音区域中掩蔽再现语音的语音再现设备制造技术

技术编号:16308397 阅读:31 留言:0更新日期:2017-09-27 02:15
本发明专利技术涉及一种用于基于接收的语音信号再现语音的语音再现设备,使得再现的语音在清晰语音区域中是可理解的,而在掩蔽语音区域中是不可理解的,该语音再现系统包括:音频处理模块,配置为接收语音信号;语音扬声器集合,配置为基于一个或多个语音扬声器信号再现语音;和掩蔽声音扬声器集合,配置为基于一个或多个掩蔽声音扬声器信号产生掩蔽声音,其中所述掩蔽声音在所述掩蔽语音区域中掩蔽所述语音;其中所述音频处理模块包括配置为基于所述语音信号的频谱和/或时间特性产生一个或多个分析信号的语音信号分析模块;其中所述音频处理模块包括配置为基于一个或多个分析信号产生一个或多个掩蔽声音信号的掩蔽声音发生器。

Speech reproducing apparatus for masking speech reproduction in a masking speech region

The invention relates to a method for speech signal receiving the voice reproduction reproduction device based on the reproduction of the speech in a clear voice in the region is understandable, but in the area of speech masking is incomprehensible, the voice reproduction system comprises an audio processing module configured to receive voice signal; a speech speaker set the configuration, for one or more of the voice signal reproducing speaker based voice and sound; masking speaker set, configured to generate one or more masking sound masking sound signal based on the loudspeaker, wherein the masking sound in the masking speech area of masking the voice; wherein the audio processing module includes a speech signal generation one or more signal analysis configuration for the spectrum of the speech signal and / or time based on the characteristics of the analysis module; wherein the audio processing module A masking sound generator configured to generate one or more masked sound signals based on one or more analytical signals.

【技术实现步骤摘要】
【国外来华专利技术】在掩蔽语音区域中掩蔽再现语音的语音再现设备
本专利技术涉及语音再现和再现语音的掩蔽。
技术介绍
不同的情形提出了语音掩蔽的应用,以下给出三个示例:1.共享的办公空间,每个员工在理解其他人的会话时,可能会从其分配的任务中分散注意力,而无论这些会话是经由电话还是直接进行。在这种情况下,语音掩蔽系统可以通过抑制语音理解来增加工作的舒适度。此外,可能需要保持会话内容保密(即,增加语音私密性),语音掩蔽系统显然可以有助于实现这一点。2.车内场景,一个人在进行可能要保密的会话,而同时在车厢内有代驾驾驶员,而两者之间没有物理屏障。在这种情况下,主要目标应当是保持会话的保密性,而驾驶员的舒适性则不那么重要,只要他不分散注意力。3.诊室,经常有允许与接待员进行免提通信的设备。在紧急情况下:接待员可能需要提及与使用该设备的患者有关的详细信息,而同时另一位患者正在接受治疗。在这种情况下,可以使用语音掩蔽系统来确保保密性。接受治疗的患者可能接受这种掩蔽,因为他们期望医生对他们自身的绝对保密。用于增加工作舒适度的语音掩蔽系统是本领域公知的。然而,这样的系统对提供语音私密性是低效的。大多数已知系统主要是为了提高工作舒适度,但是语音私密性被认为是次要的。当仅考虑由电信设备再现的声场时,也可以通过波束成形或多区域再现将再现限制到清晰语音区域。然而,除了需要大量的必要扬声器之外,这种系统永远不会实现实现足够级别的语音私密性,这是因为在掩蔽语音区域中实现的绝对声压级仍然远在人类听力阈值之上。主动噪声消除/控制方法同样如此,可能不仅消除任何再现的信号,还消除本地人类讲话者。此外,这些技术需要使用可能的多个麦克风,并且必要的自适应滤波是已知具有挑战性的任务[4]。最终,主动噪声控制仅成功地用于低频声源或简单场景,如通风管道[4]。广泛使用的方法是产生不能与语音(被掩蔽方)区分(即,在感知上分离)的掩蔽声音(掩蔽器),使得在存在掩蔽声音的同时抑制对语音的理解。术语声音掩蔽通常用于这样的系统,这是因为通常在特定区域中播放某种掩蔽器声音。一种方法是再现类似空调的背景噪声。该噪音覆盖了语音,并有助于使其呈现为不可理解。虽然可以通过播放非常大声的掩蔽声音来实现这种掩蔽,但是声音掩蔽技术意在以尽可能低的声级使用适当的掩蔽器。通常使用白噪声或粉红噪声,在低播放级别下白噪声或粉红噪声对于掩蔽语音不能非常高效地达到可以实现语音私密性的程度。下面总结先前提出的增强感应噪声的掩蔽效果的方法。在文献[12]中,作者引述了具有不明显的特性和频谱的声音(例如风或波浪声)适合实现语音私密性。该文档还陈述,如果收听者能够定位声音的起源位置则声音就会更具侵入性。已经发现掩蔽噪声的均匀不可定位分布在一些场景下是有利的。因此,[12]提出使用多个去相关噪声源来产生漫射、均匀、离域的声音空间。已经发现,如果掩蔽声音的级别对应于例如周围环境特性或者应该被掩蔽的讲话者语音的级别自适应地变化(参见例如[10],[5]),则是有利的。此外,除了级别自适应之外,掩蔽器的谱特性的自动适应已知是有益的(参见例如[11],[5])。[6]在这方面提出:自适应声音掩蔽系统和方法将不期望的声音分成时间块并估计频谱和功率级,并且连续地产生具有匹配的频谱和功率级的白噪声以掩蔽不期望的声音。其他应用产生特定的噪声形状,具有特别好地掩蔽语音的能力[9],或者产生“与源(人讲话)的特性密切匹配“的掩蔽噪声[10]。已经提出了后一种方法,其特定目的是将语音呈现为不可理解,该方法通过人工产生相似的声音或者从数据库中播放话语的随机连接,来使用非常类似于语音话语的掩蔽声音(参见例如[10],[2])。[10]使用语音来使掩蔽声音不明显。然而,这对于例如暴露于这种声音的驾驶员而言仍然可能分散注意力。已经提出的实现语音私密性的其他方法例如产生消除信号,该消除信号尝试消除预期位置处的目标语音。日本专利申请[7]公开了这种用于车厢的语音私密性保护设备。捕获会话,消除声音被馈送到不应该听到会话的位置。根据应用,掩蔽噪声通常会在讲话者周围的较大区域中再现,或者在讲话者自身附近再现(参见[10],[3]),或者通过物理手段(附加地)分开区域[8]。ChatterBlocker[1]是具有来自不同类别(声音效果,音乐嘈杂语音)的掩蔽声音的应用,这些掩蔽声音可以单独播放或组合播放,并由用户调整级别。使用播放设备(例如平板电脑)的内置扬声器或连接到播放设备的外部扬声器。
技术实现思路
本专利技术的目的是提供一种用于再现语音和用于掩蔽再现的语音的改进构思。该目的通过一种用于基于接收的语音信号再现语音的语音再现设备来实现,使得再现的语音在清晰语音区域中是可理解的,并且在掩蔽语音区域中是不可理解的,该语音再现系统包括:音频处理模块,配置为接收语音信号;语音扬声器集合,配置为基于一个或多个语音扬声器信号再现语音;和掩蔽声音扬声器集合,配置为基于一个或多个掩蔽声音扬声器信号产生掩蔽声音,其中所述掩蔽声音在所述掩蔽语音区域中掩蔽所述语音;其中所述音频处理模块包括配置为基于所述语音信号产生所述一个或多个语音扬声器信号的语音扬声器信号发生器;其中所述音频处理模块包括配置为基于所述语音信号的频谱和/或时间特性产生一个或多个分析信号的语音信号分析模块;其中所述音频处理模块包括配置为基于所述一个或多个分析信号产生一个或多个掩蔽声音信号的掩蔽声音发生器;以及其中所述音频处理模块包括配置为基于所述一个或多个掩蔽声音信号产生所述一个或多个掩蔽声音扬声器信号的掩蔽声音扬声器信号发生器。术语“语音扬声器集合”是指能够再现语音的一个或多个扬声器。类似地,术语“掩蔽声音扬声器集合”是指能够产生掩蔽声音的一个或多个扬声器。然而,一般来说,语音扬声器集合与掩蔽声音扬声器集合分开,使得特定扬声器属于语音扬声器集合或掩蔽声音扬声器集合,但不同时属于这两个集合。因此,语音扬声器可以定位成使得由语音扬声器再现的语音主要针对清晰语音区域,而掩蔽声音扬声器可以定位成使得由语音扬声器产生的掩蔽声音是主要针对掩蔽语音区域。本专利技术提供了一种改进构思,用于为无意的收听者或非预期的收听者(可以被称为窃听者)呈现不可理解的语音,而对于预期的收听者或在不同位置的预期收听者来说仍然是可理解的。在考虑的场景下,再现的语音意在在给定的区域(被称为清晰语音区域)中是可理解的。同时,在另一给定区域(被称为掩蔽语音区域)中,再现的语音应该是不可理解的,其中两个区域可以位于邻近位置。无论何时不可避免的窃听者都需要停留在预期收听者的附近,这是理想的。根据在清晰语音区域中或附近再现的语音(被掩蔽方)的属性,通过自适应地产生的掩蔽声音(掩蔽器)来抑制语音的理解。换言之:“被掩蔽方”表示必须被掩蔽的语音。在掩蔽语音区域中或附近再现掩蔽声音。语音扬声器信号发生器可以包括呈现器(render)。同样掩蔽声音扬声器信号发生器可以包括呈现器。与一些相关技术不同,本文所述的构思的目标不是掩蔽一个或多个现有讲话者的语音,而是掩蔽例如由免提通信设备再现的再现语音,其中,再现语音基于由免提通信设备接收的远端信号。本专利技术旨在实现语音私密性,而不是增加周围员工的工作舒适度。如果在讲话者附近(有意或无意地)的人无法掌握会话或理解实质,就会得到本文档来自技高网
...
在掩蔽语音区域中掩蔽再现语音的语音再现设备

【技术保护点】
一种基于接收的语音信号(SPS)再现语音(SP)的语音再现设备,使得再现的语音(SP)在清晰语音区域(CSZ)中是可理解的,而在掩蔽语音区域(MSZ)中是不可理解的,所述语音再现系统(1)包括:音频处理模块(2),配置为接收所述语音信号(SPS);语音扬声器(4)的集合(3),配置为基于一个或多个语音扬声器信号(S)再现语音(SP);和掩蔽声音扬声器(6)的集合(5),配置为基于一个或多个掩蔽声音扬声器信号(M.1、M.2、...、M.m),产生掩蔽声音(MN),其中所述掩蔽声音(MN)在掩蔽语音区域(MSZ)中掩蔽语音(SP);其中所述音频处理模块(2)包括配置为基于所述语音信号(SPS)产生所述一个或多个语音扬声器信号(S.1、...、S.n)的语音扬声器信号发生器(7);其中所述音频处理模块(2)包括配置为基于所述语音信号(SPS)的频谱和/或时间特性产生一个或多个分析信号(AS)的语音信号分析模块(8);其中所述音频处理模块(2)包括配置为基于所述一个或多个分析信号产生一个或多个掩蔽声音信号(MS.1、MS.2、MS.3、MS.4)的掩蔽声音发生器(9);以及其中所述音频处理模块(2)包括配置为基于所述一个或多个掩蔽声音信号(MS)产生所述一个或多个掩蔽声音扬声器信号(M.1、M.2、...、M.m)的掩蔽声音扬声器信号发生器(10)。...

【技术特征摘要】
【国外来华专利技术】2015.01.20 EP 15151843.81.一种基于接收的语音信号(SPS)再现语音(SP)的语音再现设备,使得再现的语音(SP)在清晰语音区域(CSZ)中是可理解的,而在掩蔽语音区域(MSZ)中是不可理解的,所述语音再现系统(1)包括:音频处理模块(2),配置为接收所述语音信号(SPS);语音扬声器(4)的集合(3),配置为基于一个或多个语音扬声器信号(S)再现语音(SP);和掩蔽声音扬声器(6)的集合(5),配置为基于一个或多个掩蔽声音扬声器信号(M.1、M.2、...、M.m),产生掩蔽声音(MN),其中所述掩蔽声音(MN)在掩蔽语音区域(MSZ)中掩蔽语音(SP);其中所述音频处理模块(2)包括配置为基于所述语音信号(SPS)产生所述一个或多个语音扬声器信号(S.1、...、S.n)的语音扬声器信号发生器(7);其中所述音频处理模块(2)包括配置为基于所述语音信号(SPS)的频谱和/或时间特性产生一个或多个分析信号(AS)的语音信号分析模块(8);其中所述音频处理模块(2)包括配置为基于所述一个或多个分析信号产生一个或多个掩蔽声音信号(MS.1、MS.2、MS.3、MS.4)的掩蔽声音发生器(9);以及其中所述音频处理模块(2)包括配置为基于所述一个或多个掩蔽声音信号(MS)产生所述一个或多个掩蔽声音扬声器信号(M.1、M.2、...、M.m)的掩蔽声音扬声器信号发生器(10)。2.根据前述权利要求所述的语音再现设备,其中,所述语音扬声器信号发生器(7)配置为产生多个语音扬声器信号(S.1、...、S.n),并且单独地控制所述多个语音扬声器信号(S.1、...、S.n)中的每个语音扬声器信号(S.1、...、S.n)的特性,以便控制语音(SP)的空间线索。3.根据前述权利要求中任一项所述的语音再现设备,其中,所述掩蔽声音扬声器信号发生器(10)配置为产生多个掩蔽声音扬声器信号(M.1、M.2、...、M.m)并且单独地控制所述多个掩蔽声音扬声器信号(M.1、M.2、...、M.m)中的每个掩蔽声音扬声器信号(M.1、M.2、...、M.m)的特性,以便控制掩蔽声音(MN)的空间线索。4.根据前述权利要求中任一项所述的语音再现设备,其中,所述掩蔽声音发生器(9)包括:多个掩蔽声源(11.1、11.2、11.3、11.4),配置为提供原始掩蔽声音信号(RMS.1、RMS.2、RMS.3、RMS.4);和多个原始掩蔽声音信号适配模块(12.1、12.2、12.3、12.4),其中每个原始掩蔽声音信号适配模块(12.1、12.2、12.3、12.4)被分配给掩蔽声源(11.1、11.2、11.3、11.4)之一,其中分配的掩蔽适配模块(12.1、12.2、12.3、12.4)配置为基于所述分析信号(AS)来适配相应掩蔽声源(11.1、11.2、11.3、11.4)的原始掩蔽声音信号(RMS.1、RMS.2、RMS.3、RMS.4),以便产生所述一个或多个掩蔽声音信号(MS.1、MS.2、MS.3、MS.4)之一。5.根据权利要求4所述的语音再现设备,其中,所述至少一个掩蔽声源(11.1、11.2、11.3、11.4)包括配置为提供原始音乐掩蔽声音信号(RMS.1)的音乐源(11.1),其中,分配的掩蔽适配模块(12.1)配置为基于所述分析信号(AS)来适配原始音乐掩蔽声音信号(RMS.1),以便产生所述一个或多个掩蔽声音信号(MS.1、MS.2、MS.3、MS.4)中的一个掩蔽声音信号(MS.1)。6.根据权利要求4或5所述的语音再现设备,其中,所述至少一个掩蔽声源(11.1、11.2、11.3、11.4)包括配置为提供原始连续噪声掩蔽声音信号(RMS.2)的连续噪声源(11.2),其中,分配的掩蔽适配模块(12.2)配置为基于所述分析信号(AS)来适配原始连续噪声掩蔽声音信号(RMS.2),以便产生所述一个或多个掩蔽声音信号(MS.1、MS.2、MS.3、MS.4)中的一个掩蔽声音信号(MS.2)。7.根据权利要求4至6中任一项所述的语音再现设备,其中,所述至少一个掩蔽声源(11.1、11.2、11.3、11.4)包括配置为提供原始动态噪声掩蔽声音信号(RMS.3)的动态噪声源(11.3),其中,分配的掩蔽适配模块(12.3)配置为基于所述分析信号(AS)来适配原始动态噪声掩蔽声音信号(RMS.3),以便产生所述一个或多个掩蔽声音信号(MS.1、MS.2、MS.3、MS.4)中的一个掩蔽声音信号(MS.3)。8.根据前述权利要求中任一项所述的语音再现设备,其中,所述音频处理模块(2)包括配置为基于所述语音信号(SPS)提供适配的语音信号(ASPS)的自适应语音处理模块(13),其中所述语音扬声器信号发生器(7)配置为基于适配的语音信号(ASPS)产生所述一个或多个语音扬声器信号(S.1、...、S.n)。9.根据前述权利要求中任一项所述的语音再现设备,其中,所述音频处理模块(2)配置为接收包含与所述语音扬声器(4.1、...、4.n)的集合(3)的设置和/或掩蔽声音扬声器(6.1、6.2、...、6.m)的集合(5)的设置有关的信息的设置信号(SI)。10.根据前述权利要求中任一项所述的语音再现设备,其中,所述掩蔽声音发生器(9)配置为接收包含与天气状况...

【专利技术属性】
技术研发人员:安德烈亚斯·沃尔瑟马丁·施耐德伊曼纽尔·哈比兹奥立弗·赫尔穆特
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国,DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1