当前位置: 首页 > 专利查询>英特尔公司专利>正文

相机驱动的音频空间化制造技术

技术编号:14676581 阅读:55 留言:0更新日期:2017-02-19 02:02
提供相机驱动的音频空间化的方法和装置。相机输入可由计算机使用以支持音频空间化或改善已支持它的应用的音频空间化。计算机系统可例如通过修正所渲染的音频分组的相对延时或相对振幅来支持音频空间化。如果声音打算例如位于用户的左侧,则在位于用户左耳上的耳机扬声器上渲染的音频声道相比其它音频声道可具有一定程度减小的延时和增加的振幅。

【技术实现步骤摘要】
本申请是申请日为2013年09月27日、申请号为201310450066.6、题为“相机驱动的音频空间化”的专利技术专利申请的分案申请。
技术介绍
这总地涉及电气地产生三维声音的效果。大量音频设备尝试通过电气地改变扬声器输出和其它技术从扬声器阵列重建三维声音。通常,人们喜欢听到来自不同方向的声音。本文中使用的“三维声音”表示来自两个以上方向的声音。附图简述参照以下附图描述一些实施例。图1是用户接收三维声音的的立体图;图2是对本专利技术的一个实施例的硬件描绘。图3是本专利技术的一个实施例的流程图;图4是一个实施例的系统描绘;以及图5是一个实施例的前侧立面图。具体实施方式音频空间化指的是用户感觉三维空间中的音频的能力。这意味着用户检测与声音的方向和距离有关的音频信息。在个人计算机上回放的音频流要么天生就是立体声,要么它们是多声道音频系统,它们在内置在多数个人计算机内的两个扬声器上或连接至个人计算机的一组耳机上回放之前被向下混频至立体声。立体声音频流天然地不包含在某些环绕声系统中包含的音频信息量。然而,甚至在立体声音频流中也可采用特殊音频空间化技术来给予它们所缺乏的一些三维声音内容。人类听觉系统使用若干线索来实现音源定位,包括时间差、振幅差、谱信息、时序分析以及关联分析,这里仅给出一些示例。例如,来自收听者右侧的声音在其击中左耳之前稍早地击中右耳并具有稍高的强度。另外,来自更远处的声音可能因为减小的较高频率内容而具有较低的振幅。这些类型的线索由人类听觉系统使用以定位空间内的声音。这与人脑分析其从左眼和右眼接受的图像之间的差异以提取视觉三维信息的方式相似。音频空间化技术后处理音频流但不将用户相对于产生音频流的声音系统在空间中的位置考虑在内。当用户例如佩戴耳机时,扬声器中的换能器随着用户的头部而移动。因此,打算从特定的方向和距离传来的声音与用户的头部一起移动。在一些实施例中,基于处理器的设备上的相机输入可改善音频内容的空间化。可使用多种个人计算设备,包括笔记本、平板计算机、智能电话以及视频相机本身。在一些实施例中可使用嵌入式常开相机。移动平台上的已有嵌入式相机可通过向平台提供关于用户相对于该平台的当前位置的信息而改善用户的三维音频体验。在一些实施例中,用户可收听在耳机上渲染的音频流。音频空间化技术也可应用在渲染于个人计算机的传统嵌入式扬声器上的音频流上,但当使用耳机时其影响被更清楚地觉察到。音频流可在任何时间在个人计算机系统上激活。这些流包括通过诸如视频回放应用之类的应用产生的系统声音或音频内容。音频流可由立体声音频的两个声道构成或在5.1或7.1音频的情形下由两个以上的声道构成。在两个以上声道的情形下,音频声道被向下混频至两个声道,以使它们能在两个耳机上被渲染。否则,如果立体声系统连接至个人计算机,则该向下混频是不需要的。或者,可通过不同的流驱动各种扬声器。典型地,通过个人计算机系统产生的声音和通过多数应用产生的音频流不包括空间化效果,因此用户相对于个人计算机系统的位置无关紧要。如果用户使用耳机并产生系统声音,则声音一直来自左耳或右耳方向,而不管用户的头部朝向哪个方向。另一方面,一些应用可支持音频空间化,但它们假设用户位置处于计算机前方的三维空间内的一些默认位置并且他或她一直看向计算机屏幕。该默认位置和朝向通过图1中的X、Y、Z轴的原点表示,其中用户的位置被定义为用户双眼之间的点的位置。相机输入可由计算机使用以支持音频空间化或改善已支持它的应用的音频空间化。计算机系统可例如通过修正所渲染的音频分组的相对延时或相对振幅来支持音频空间化。如果声音打算例如位于用户的左侧,则在位于用户左耳上的耳机扬声器上渲染的音频声道相比其它音频声道可具有一定程度减小的延时和增加的振幅。然而,个人计算机可使用多种其它技术形成音频定位效果。一般来说,人头部的位置和朝向影响到他或她对空间内的声音的感知。位置或朝向影响到所感知的声音方向和距离。为了将该范例(paradigm)传至个人计算机设备的用户,用户头部的位置和朝向对于他或她对通过该个人计算机产生的声音的感知具有影响。例如,如果在用户将他或她的头转向右侧的同时图1所示的计算机系统产生声音,那么如果系统的声音要在空间中被定位,则它应当被感知为就像其来自用户的左侧。为了能够空间化该声音,计算机可以知道用户的当前位置和朝向。图1所示的XYZ轴表示用户的默认位置。图1所示的X’Y’Z’轴表示当用户已将他或她的头移动至点(x1,y1,z1)并且他或她已将他或她的头垂直和水平地转过角度a1和b1时作用的空间中的新用户位置和朝向。可使用向量(x1,y1,z1,a1,b1)来指示用户在空间内的新位置和朝向。然后计算机可使用其嵌入式相机和视频分析法识别用户的新位置和朝向以确定位置和朝向。例如,一旦已使用视频分析法确定用户双眼之间的点的位置,就能很容易确定该点与计算机的距离。基于该距离,可对给定其朝向的每个耳调整声音的振幅。当计算机渲染不支持空间化的音频流时,可使用相机输入来提供遗失的三维信息。用户在计算机前方的空间内的位置和朝向可从相机输入导出。例如,如果视频回放应用渲染来自屏幕“内”正前方某一距离的爆炸声,但用户的位置为计算机的略为向左,则用户应当感觉到爆炸来自略为向右的方向。这可通过操控在耳机上渲染的音频流的延时和振幅来完成。当特定应用渲染空间化音频时,它也可使用源自计算机嵌入式相机的信息以相似方式被后处理。例如,如果应用渲染打算定位用户左侧的声音但用户实际始终将他或她的头转向右侧,则该声音实际应当被渲染以使其被感觉为来自用户头部后方的位置。由此计算机可使用来自用户当前位置和朝向的信息并对音频流作后处理以形成声音位于用户头部后方的印象。前面的示例假设用户朝向的极端改变。在许多真实生活的情形下,用户可稍偏离图1所示的默认位置地定位或倾斜,以使在音频流上执行的空间化处理反映更小和更柔软的位置和朝向改变。音频解码和后处理一般可在平台上的许多不同的位置处执行。这可通过软件,例如通过应用来完成。这可在嵌入到主处理单元或嵌入到芯片集上的音频数字信号处理器(DSP)来完成。这也可在图形引擎上完成,该图形引擎包括在中央处理单元内的独立或集成的图形引擎。尽管给出了在集成的DSP上执行音频处理的示例,然而这里解释的理念可应用在所有情形下。图2所示的音频数字信号处理器12可直接或间接地连接至音频编解码器16,该音频编解码器16将个人计算机音频输出驱动至耳机或扬声器18。当应用或操作系统产生音频/视觉流时,这些流可被传递至音频数字信号处理器12以供附加处理并从那里传至音频编解码器16和耳机或扬声器18。为了取得音频空间化效果,音频DSP驱动器能与嵌入式相机驱动器通信并从中接收关于用户的当前位置和头部朝向的信息。通过该信息,DSP12对经渲染的音频流施加适当的后处理以取得要求的空间化效果。例如,如果DSP正在渲染两个潜在向下混频的音频流,则当根据用户的当前位置在用户耳机上渲染这些音频流时可对这两个流采用适当的延时或振幅操控以使它们空间化。DSP驱动器可与相机驱动器交换信号(潜在地经由标准操作系统接口)并接收关于当前用户位置的输入。该交换信号可以许多不同方式完成。例如,它可通过使用在每隔那么多可编程毫秒发生的周期性系统中断本文档来自技高网...
相机驱动的音频空间化

【技术保护点】
一种装置,包括:处理器,用于调整由基于处理器的系统向耳机提供的用户头部的声音以产生三维音效,所述三维音效依赖于用户头部相对于系统的朝向,其中所述处理器用于基于用户与系统的距离以及用户头部相对于系统的朝向从所述基于处理器的系统产生声音;以及存储装置,与所述处理器耦合。

【技术特征摘要】
2012.09.27 US 13/628,4641.一种装置,包括:处理器,用于调整由基于处理器的系统向耳机提供的用户头部的声音以产生三维音效,所述三维音效依赖于用户头部相对于系统的朝向,其中所述处理器用于基于用户与系统的距离以及用户头部相对于系统的朝向从所述基于处理器的系统产生声音;以及存储装置,与所述处理器耦合。2.如权利要求1所述的装置,包括与所述处理器耦合的视频相机。3.如权利要求1所述的装置,包括与所述处理器耦合的头戴式耳机。4.如权利要求1所述的装置,包括与所述处理器耦合的显示器。5.如权利要求1所述的装置,其中所述处理器用于调整延时以考虑到用户头部的位置或朝向。6.如权利要求1所述的装置,其中所述处理器用于使用视频分析确定用户头部的位置和朝向。7.如权利要求1所述的装置,其中所述处理器用于基于用户头部的位置产生三维音效。8.如权利要求1所述的装置,包括显示器,所述处理器用于基于用户相对于所述显示器的位置调整声音。9.如权利要求1所述的装置,其中所述耳机是头戴式耳机。10.一种方法,包括:调整由基于处理器的系统向耳机提供的用户头部的声音以产生三维音效,所述三维音效依赖于用户头部相对于系统的...

【专利技术属性】
技术研发人员:N·卡布拉塞斯S·W·程D·沃雷尔
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1