定位声音信号源的位置制造技术

技术编号:4928541 阅读:182 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及通过使用说话人佩戴的物品(20)上的图案(21)的图片来定位该人的位置。该物品(20)带有复杂图案(21),该复杂图案(21)被优化用以确定该物品(20)的方向、从该物品到麦克风设备(4)和/或照相机(11)的距离。此外,该图案(21)可以被安排用于识别携带该物品(20)的人。对携带该物品(20)的人的位置的确定可以用于增强语音识别(SR)和/或用于提供对例如医院或工业环境中的设备(DC)的免提语音控制。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种用于定位声音信号源的位置的系统和方法。本专利技术还涉及一种 被安排用于遮挡人的面部的至少一部分的防护罩,该防护罩用于在本专利技术的系统或方法 中使用。最后,本专利技术涉及一种使处理器能够执行本专利技术方法的计算机程序。
技术介绍
由于卫生、安全和方便的原因,设备的免提声音控制在许多场合(例如像工业 环境或在医院手术室中)都是有用的。为了达到设备声音控制或语音控制的充分性能, 并入了语音识别系统。对于这种语音识别系统而言,重要的是捕获的声音或语音具有非 常好的质量。其它声音或噪声源具有很大的影响,并且可能使得语音识别系统失效。为 了改善语音信号的质量,可以使用各种信号处理技术,例如滤波、噪声抑制以及波束形 成。在波束形成技术的情况下,可以使用捕获的音频信号来控制波束,或者在更先进的 系统中通过使用附加的视频信号来控制波束。只有在控制用户相对于系统的位置或方位 已知时,这种控制才是可能的。音频定位技术提供了声源的位置。可以利用计算机视觉 技术识别人。可以将这两种技术组合起来用以定义控制用户或期望用户。有时将来自语 音识别器的反馈用于定义谁应该例如通过说出激活命令来控制系统。在US 2006/0104454A1中,一种用于选择性拾取语音信号的系统使用图像分析 算法、基于识别特征来识别希望给该系统声音命令的至少一个人的位置,来关注一组说 话者中希望向该系统传递某些信息的说话者。所检测到的位置用于调整定向麦克风以适 应该至少一个人。在医院环境中,声音控制用户可以是医生、心脏病专家或外科医生。通常,他 们在诊断或介入治疗过程中使用声音控制。环境通常是无菌的。医生一般佩戴口罩。在 工业环境中,技术人员通常佩戴完整的面罩。在这样的环境中找到说话的人可能是一件 难以执行的任务。由于吵杂的环境和很多说话的人,音频定位技术不足以跟踪或定位声 源。在面部或其一部分被遮挡的情况下,计算机视觉也可能失效。因此,一种用于对通过声音控制设备的人的位置进行定位的改进系统和方法会 是有优势的。特别地,在面部或其一部分被遮挡的情况下,一种用于对通过声音控制设 备的人的位置进行定位的更可靠的系统和方法会是有优势的。
技术实现思路
优选地,本专利技术力图提供一种用于定位通过声音控制设备的人的位置的改进系 统和方法。具体地,可以将提供一种如下的可靠系统和方法视为本专利技术的目的其解决 上文提到的、现有技术关于定位他/她的面部的一部分被遮挡的人的问题。在本专利技术的第一方面中,通过提供用于定位声音信号源的位置的系统来获得这 一目的和一些其它目的,所述系统包括被安排为由具有发音器官的人佩戴的物品,所 述发音器官被安排用于作为声音信号源,所述物品包括视觉上可检测的图案,所述图案被放置在离开声音信号源的一距离处;照相机设备,被安排用于记录所述图案或其一部 分的至少一幅图片;定位模块,用于基于所述至少一幅图片确定所述图案的位置;至少 一个麦克风,被安排用于基于所述图案的位置以及所述图案与声音信号源之间的距离来 适应所述声音信号源的位置;其中,所述定位模块被配置为基于图像处理来确定所述声 音信号源的位置,其中图像处理是在所述图案或其一部分的所述至少一幅图片上单独执 行的。当在所述图案或其一部分的一幅或多幅图片上执行图像处理时,确定所述图案的 位置可能比采用面部定位方法或面部检测算法更可靠和/或更简单,这是因为这种面部 定位或检测方法具有相对较高的错误接受率。与面部识别或面部检测算法相比,使用图 案_位置确定顾及了更好且更可靠的检测率。所述图案应当包括足够的信息以确定所述 照相机设备与携带所述图案的所述物品之间的距离。应当注意的是,任何合适的图像处理或图像分析技术均可用来处理所述图案或 其一部分的所述至少一幅图片。此外,应当注意的是,术语“至少一幅图片”可以表示 单个的图片、静止的图像以及图片序列或视频序列。此外,应当强调的是,距离可以是 大于或等于零的任何合适的距离,使得所述物品的所述图案可以被安排在人的嘴部(例 如嘴前),或者被安排在离开人的嘴部的一距离处。所述物品可以是被安排用于由人所佩戴的任何物品。它可以是防护罩,例如口 罩或面罩,或者完整的面罩。可替换地,它可以是被放置在人的衣服上的物品,例如徽 章或标签。它也可以是由人佩戴的任何其它合适的一件衣物或设备,例如徽章、眼镜、 耳机、领带、工作服、医生的白大褂、防护服等等。根据另一个方面,所述系统还包括补偿模块,被安排为对所述物品的所述图 案与佩戴所述物品的所述人的发音器官之间的位置差进行补偿。如果所述物品被安排为 放置在离开人的嘴部的一距离处,例如如果所述物品是放置在夹克上的徽章或者如果所 述物品是人所佩戴的眼镜的一部分,则这点是特别有优势的。补偿模块可以是定位模块 的一部分。根据另一个方面,视觉上可检测的图案是复杂的图案。当视觉上可检测的图案 是复杂图案时,它可以用来可靠地确定所述物品相对于照相机设备的位置和/或方向。 术语“复杂图案”旨在表示比单条直线更复杂的任何图案。因此,复杂图案可以是曲 线、具有多个部分(例如多个点)的图案、大量的线条或其任意组合。复杂图案可以是 适合于指示垂直、水平和/或旋转方向和/或离所述图案的距离的任何图案和/或适合于 嵌入关于例如人、日期、时间等的信息的任何图案。此外,使用所述物品上的复杂图案使得在所述图案中嵌入关于例如用户身份、 设备使用授权、设备优选设置、物品与照相机设备间距离等的信息成为可能。复杂图案 可以是冗余的,使得如果所述至少一幅图片只包含所述图案的一部分,对所述图案进行 识别也是可能的。根据另一个方面,所述图案包括条形码和/或不同的颜色。它可以附加地或可 替换地包括可选择特定大小的标识、字母、数字或任何其它类型的复杂形状。因此,所 述图案携带有对检测包含所述图案的物品的位置有用的信息。根据另一个方面,所述物品包括显示器,被安排用于显示所述视觉上可检 测的图案。因此,所述物品上的图案可以及时变化。这种显示器的例子有液晶显示器(LCD)、柔性显示器或Lumalive 显示板。根据另一个方面,所述图案是旋转对称的,使得所述物品是旋转不变的。因 此,所述物品的方向是无关的,由此所述物品不会被错误地定向。可替换地,所述图案 包括足以确定所述物品的方向的信息。例如,如果针对所述物品的不同部位所述图案是 不同的,则可以容易地确定所述物品的方向。因此,例如,可以确定佩戴所述物品的人 部分地从照相机设备转离。在另一个实施例中,所述物品是被安排用于遮挡人的面部的至少一部分的防护 面具。这种面具可以是适合于医务人员(例如医生、护士等)使用的口罩或面罩,或者 可以是适合于在工业领域内使用的完整面具。根据另一个方面,本专利技术涉及一种用于定位声音信号源的位置的方法,所述方 法包括如下步骤使具有发音器官的人佩戴一物品,所述发音器官被安排用于作为声音 信号源,其中所述物品包括视觉上可检测的图案,并且其中,所述图案被安排用于放置 在离开所述声音信号源的一距离处;通过照相机设备记录所述图案或其一部分的至少一 幅图片;通过定位模块基于所述至少一幅图片来确定所述图案的位置;以及基于所述 图案的位置及所述图案与所述声音信号源之间的距离,调整至少一个麦克风以适应所述 声音信号源的位置;其中,所述定位模本文档来自技高网
...

【技术保护点】
一种用于定位声音信号源的位置的系统(10),包括:  物品(20),被安排为由具有发音器官的人佩戴,所述发音器官被安排用于作为声音信号源,所述物品(20)包括视觉上可检测的图案(21),所述图案(21)被放置在离开所述声音信号源的一距离处;照相机设备(11),被安排用于记录所述图案(21)或其一部分的至少一幅图片;  定位模块,用于基于所述至少一幅图片确定所述图案(21)的位置;以及  麦克风设备(14),被安排用于基于所述图案(21)的位置以及所述图案(21)与所述声音信号源之间的距离来适应所述声音信号源的位置;  其中,所述定位模块被配置为基于图像处理来确定所述声音信号源的位置,其中对所述图案(21)或其一部分的所述至少一幅图片单独执行所述图像处理。

【技术特征摘要】
【国外来华专利技术】EP 2008-5-8 08155872.81.一种用于定位声音信号源的位置的系统(10),包括物品(20),被安排为由具有发音器官的人佩戴,所述发音器官被安排用于作为声音 信号源,所述物品(20)包括视觉上可检测的图案(21),所述图案(21)被放置在离开所述 声音信号源的一距离处;照相机设备(11),被安排用于记录所述图案(21)或其一部分的至少一幅图片; 定位模块,用于基于所述至少一幅图片确定所述图案(21)的位置;以及 麦克风设备(14),被安排用于基于所述图案(21)的位置以及所述图案(21)与所述声 音信号源之间的距离来适应所述声音信号源的位置;其中,所述定位模块被配置为基于图像处理来确定所述声音信号源的位置,其中对 所述图案(21)或其一部分的所述至少一幅图片单独执行所述图像处理。2.如权利要求1所述的系统,其中,所述系统(10)还包括补偿模块,被安排为对所述物品(20)的所述图案(21)与佩戴所述物品(20)的所述 人的所述发音器官之间的位置差进行补偿。3.如权利要求1或2所述的系统(10),其中,所述图案(21)是复杂图案。4.如权利要求1至3中的任一项所述的系统,其中,所述图案(21)包括条形码和/ 或不同的颜色。5.如权利要求1至4中的任一项所述的系统,其中,所述物品(20)包括显式器,其 被安排用于显示所述视觉上可检测...

【专利技术属性】
技术研发人员:AAML布鲁克斯BE萨鲁科TAM凯沃纳尔
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:发明
国别省市:NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1