用于使用姿势识别的音频引导的方法和设备技术

技术编号:38423103 阅读:12 留言:0更新日期:2023-08-07 11:22
公开了一种用于从显示设备的扬声器线性阵列朝向用户方向的音频引导的方法和设备。从显示设备的至少一个传感器获得对应于观看者姿势的数据。基于所获得的数据来确定观看者与耦合到显示器的多个扬声器之间的距离和角度。基于所确定的距离和角度,将相移应用于为该多个扬声器供电的音频信号,从而使音频引导朝向用户方向。用户方向。用户方向。

【技术实现步骤摘要】
【国外来华专利技术】用于使用姿势识别的音频引导的方法和设备


[0001]本公开一般涉及音频引导。至少一个实施方案涉及从显示设备的扬声器线性阵列朝向用户方向的音频引导。

技术介绍

[0002]当若干人正在显示设备上观看视频内容时,有时他们中的一些可能不太感兴趣或被分心。参照图1,示出了示例性组设置,其中在显示设备50正在显示视频内容的区域中示出了许多人。在该视图中,一些人可能被电话呼叫100分心,其他人可能彼此110交谈,一些人可能浏览平板电脑120,以及/或者一些人130可能实际上有兴趣观看所显示的视频内容。这种情况可能使得想要观看视频内容的那些人不舒服。通常,有人会把显示设备上的音量调大,而在打电话或彼此交谈的其他人会更大声地说话,从而加剧了该问题。
[0003]克服这种情况的一种方法是将音频引导朝向对观看视频内容感兴趣的人。例如,波束成形方法可用于配备有扬声器阵列(例如,条形音箱)的显示设备的音频信号处理。参照图2,通过控制扬声器阵列210的呈现,使用波束成形技术(诸如例如,延迟和求和),可以朝向房间中的特定位置/人130生成音频波形的相长干涉220,并且可以在房间中其他地方生成音频波形的相消干涉(未示出)。对于这种情况,音频波形在朝向对观看视频内容感兴趣的人130的方向230上被引导。
[0004]遗憾的是,音频波束成形技术通常依赖于校准步骤,其中使用控制点阵列(例如,麦克风阵列)来确定音频波束将被引导朝向的角度和距离。通过测量由扬声器发出的声音与由麦克风接收的声音之间的延迟来进行这种确定。这是一个耗时的步骤,其也将取决于房间中人的位置,这可能是事先未知的。此外,需要预先执行校准步骤,这可能与按需情形不兼容。另外,消费电子设备需要是用户友好的,而不需要校准步骤。鉴于以上内容设计了本文的实施方案。

技术实现思路

[0005]本公开涉及一种使用观看者姿势来发起从显示设备的扬声器线性阵列朝向用户方向的音频引导的方法。该方法可以考虑在诸如例如数字电视、平板电脑和移动电话之类的显示设备上的实现。
[0006]根据本公开的第一方面,提供了一种设备,包括具有图像传感器和至少一个处理器的显示设备。该至少一个处理器被配置为:从图像传感器获得对应于观看者姿势的数据;基于所获得的数据来确定观看者与耦合到显示器的多个扬声器之间的距离和角度;以及基于所确定的距离和角度,将相移应用于为多个扬声器供电的音频信号。
[0007]根据本公开的第二方面,提供了一种方法,包括:从显示设备的至少一个图像传感器获得对应于观看者姿势的数据;基于所获得的数据来确定观看者与耦合到显示器的多个扬声器之间的距离和角度;以及基于所确定的距离和角度,将相移应用于为多个扬声器供电的音频信号。
[0008]所提出的解决方案的一般原理涉及使用观看者姿势来发起从显示设备的扬声器线性阵列朝向用户方向的音频引导。基于与显示设备的无触摸交互来在运行中执行音频引导,无需依赖于校准步骤或遥控设备的使用。
[0009]由本公开的要素实现的一些过程可以是计算机实现的过程。因此,此类要素可以采取完全硬件实施方案、完全软件实施方案(包括固件、常驻软件、微代码等)或者将软件方面和硬件方面结合的实施方案的形式,这些实施方案在本文中可以统称为“电路”、“模块”或“系统”。此外,此类元件可以采取计算机程序产品的形式,该计算机程序产品实现于具有体现在媒体中的计算机可用程序代码的任何有形表达介质中。
[0010]由于本公开的要素可以用软件来实现。因此本公开可以实施为用于在任何合适的载体介质上提供给可编程装置的计算机可读代码。有形非暂态载体介质可以包括存储介质,诸如软盘、CD

ROM、硬盘驱动器、磁带设备或固态存储设备等。瞬态载体介质可以包括信号,诸如电信号、光信号、声信号、磁信号或电磁信号,例如微波或RF信号。
附图说明
[0011]实施方案的其他特征和优点根据以下通过指示性和非穷举性示例的方式给出的描述以及附图应当显而易见,在附图中:
[0012]图1示出了现有技术的示例性组设置,其中在电视正在显示视频内容的区域中示出了若干人;
[0013]图2示出了示例性现有技术音频波束成形技术;
[0014]图3示出了根据本公开的示例性实施方案的用于从显示设备朝向用户方向的音频引导的装置;
[0015]图4是根据本公开的示例性实施方案的所提出的用于从显示设备的扬声器线性阵列朝向用户方向的音频引导的方法的具体实施方案的流程图;
[0016]图5示出了可用于实现本公开的示例性实施方案的用户姿势的图示;
[0017]图6示出了可用于实施本公开的示例性实施方案的另一用户姿势的图示;
[0018]图7示出了用户姿势以及获得对应于该用户姿势的数据的图示;
[0019]图8示出了图7中所示的用户姿势以及获得对应于该用户姿势的数据的顶部视图的图示;
[0020]图9示出了第一位置处的观看者姿势的侧视图的图示;
[0021]图10示出了第二位置处的观看者姿势的另一侧视图的图示;并且
[0022]图11示出了可用于实现本公开的示例性实施方案的扬声器(音频)阵列的图示。
具体实施方式
[0023]图3示出了根据本公开的实施方案的用于从显示设备朝向用户方向的音频引导的示例性装置。图1示出了可实现示例性实施方案的各个方面的示例性装置300的框图。该装置可包括显示设备305和音频阵列330。
[0024]显示设备305可以是包括显示屏(未示出)的任何消费电子设备,诸如例如数字电视。显示设备305包括至少一个处理器320和传感器310。处理器320可以包括被配置为确定相对于用户位置的距离和角度估计的软件。处理器320还可被配置为确定应用于为音频阵
列330供电的音频信号的相移。传感器310识别由显示设备305的用户(未示出)执行的姿势。
[0025]处理器320可以包括嵌入式存储器(未示出)、输入

输出接口(未示出),以及本领域已知的各种其他电路。程序代码可被加载到处理器320中以执行下文描述的各种过程。
[0026]另选地,显示设备305还可包括至少一个存储器(例如,易失性存储器设备、非易失性存储器设备),其存储待加载到处理器320中以供后续执行的程序代码。显示设备305可以另外包括存储设备(未示出),该存储设备可以包括非易失性存储器,包括但不限于EEPROM、ROM、PROM、RAM、DRAM、SRAM、闪存、磁盘驱动器和/或光盘驱动器。作为非限制性示例,存储设备可以包括内部存储设备、附接存储设备和/或网络可访问的存储设备。
[0027]传感器310可以是能够识别由显示设备305的用户执行的姿势的任何设备。在一个示例性实施方案中,传感器可以是例如相机,并且更具体地是RGB相机。传感器310可在显示设备305内部,如图3所示。另选地,在示例性实施方案中,传感器310可以在显示设备305外部。对于这种情况,传感器310可以优选本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种设备,所述设备包括:显示设备,所述显示设备包括图像传感器;和至少一个处理器,所述至少一个处理器被配置为:从所述图像传感器获得对应于观看者的姿势的数据;基于所获得的数据来确定所述观看者与耦合到所述显示设备的多个扬声器之间的距离和角度;以及基于所确定的距离和角度,将相移应用于为所述多个扬声器供电的音频信号。2.根据权利要求1所述的设备,其中所述图像传感器是相机。3.根据权利要求1或2所述的设备,其中所述观看者姿势是手势、面部表情、从一侧到另一侧的头部移动、点头和从一侧到另一侧的手臂移动中的一者。4.根据权利要求3所述的设备,其中所述手势是将一只手掌举起放平、举起多个手指中的一个手指、举起拇指以及通过使任何手指与所述拇指接触来形成圆中的一者。5.根据权利要求1至4中任一项所述的设备,其中所述多个扬声器被配置为线性阵列。6.根据权利要求1至5中任一项所述的设备,其中所述多个扬声器被定位成邻近所述显示设备的底部部分。7.根据权利要求1至6中任一项所述的设备,其中所述多个扬声器中的每个扬声器的输入耦合到利用音频源馈送的相移增益控制器。8.根据权利要求1至7中任一项所述的设备,其中所述观看者姿势被用来引导为所述多个扬声器供电的所述音频信号远离所述观看者的位置的相移。9.根据权利要求1至8中任一项所述的设备,其中基于针对第一位置和第二位置的观看者姿势的图像来获得所述图像传感器的图像传感器焦距。10.根据权利要求3或4所述的设备,其中使用基于面部捕捉的性别和年龄估计来获得所述手势的手部大小。11.一种方法,所述方法包括:从显示设备的至少一个图像传感器...

【专利技术属性】
技术研发人员:H
申请(专利权)人:交互数字CE专利控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1