生成环绕立体声声场制造技术

技术编号:10824375 阅读:134 留言:0更新日期:2014-12-26 12:52
本申请涉及生成环绕立体声声场。具体地,提出一种用于生成环绕立体声声场的方法、装置和计算机程序产品。该方法包括:接收由多个音频捕获设备捕获的音频信号;估计多个音频捕获设备的拓扑;并且至少部分地基于估计的拓扑从接收的音频信号生成环绕立体声声场。

【技术实现步骤摘要】
生成环绕立体声声场
本专利技术涉及信号处理。更具体地,本专利技术的实施例涉及生成环绕立体声声场。
技术介绍
传统上,环绕立体声声场或是由专用的环绕立体声声场记录设备装置创建,或者 由专业的混音工程师或软件应用将声源平推到不同的声道而生成。这两种办法对终端用户 来说都无法轻易实现。在过去的数十年中,诸如移动电话、平板电脑、媒体播放器和游戏机 等越来越多的普适移动设备已经配备有音频捕获和/或处理功能。然而,多数移动设备(移 动电话、平板电脑、媒体播放器、游戏机)仅被用于实现单声道音频捕获。 已经提出了多种方法用于使用移动设备来创建环绕立体声声场。然而,这些方法 或者严格依赖接入点,或者没有将日常使用的非专业移动设备的特性纳入考虑。例如,在使 用异质用户设备的自组织(ad hoc)网络生成环绕立体声声场时,不同移动设备的记录时间 可能是不同步的,并且移动设备的位置和拓扑可能是未知的。而且,音频捕获设备的增益及 频率响应可能不同。因此,目前,无法通过日常用户所使用音频捕获设备而有效且高效地生 成环绕立体声声场。 有鉴于此,在本领域中需要一种能够以有效且高效的方式生成环绕立体声声场的 解决方案。
技术实现思路
为了解决上述和其他潜在问题,本专利技术的实施例提出一种用于生成环绕立体声声 场的方法、装置和计算机程序产品。 在一个方面,本专利技术的实施例提供一种生成环绕立体声声场的方法。该方法包括: 接收由多个音频捕获设备捕获的音频信号;估计多个音频捕获设备的拓扑;以及至少部分 地基于估计的拓扑从接收的音频信号生成环绕立体声声场。该方面的实施例还包括相应的 计算机程序产品,该计算机程序产品包括有形地包含于机器可读介质上的用于执行该方法 的计算机程序。 在另一方面,本专利技术的实施例提供一种生成环绕立体声声场的装置。该装置包含: 接收单元,被配置为接收由多个音频捕获设备捕获的音频信号;拓扑估计单元,被配置为估 计多个音频捕获设备的拓扑;以及生成单元,被配置为至少部分地基于估计的拓扑生成环 绕立体声声场。 可以实现本专利技术的这些实施例以实现以下一个或多个优点。根据本专利技术的实施 例,环绕立体声声场可以通过使用终端用户的音频捕获设备(诸如装备在移动电话上的麦 克风)的自组织网络而生成。由此,可以不再需要昂贵且复杂的专业设备和/或人类专家。 此外,通过基于对音频捕获设备的拓扑估计而动态地生成环绕立体声声场,可以将环绕立 体声声场的品质维持在较高水平。 通过连同附图阅读下列【具体实施方式】,还将理解本专利技术的实施例的其他特征和优 势,附图以示例方式图示了本专利技术的精神和原理。 【附图说明】 本专利技术的一个或多个实施例的细节在下列附图和描述中阐明。本专利技术的其他特 征、方面和优势将从描述、附图和权利要求中变得明显,其中: 图1示出了本专利技术的示例实施例可实现于其中的系统的框图; 图2A-图2C示出了根据本专利技术示例实施例的音频捕获设备的拓扑的若干示例的 示意图; 图3示出了根据本专利技术示例实施例的用于生成环绕立体声声场的方法的流程图; 图4A-图4C分别不出了在使用一个不例映射矩阵时针对各种频率的B-格式处理 中的W、X和Y声道的极性图(polar pattern)的示意图; 图5A-图5C分别示出了在使用另一示例映射矩阵时针对各种频率的B-格式处理 中的W、X和Y声道的极性图的示意图; 图6示出了根据本专利技术示例实施例的用于生成环绕立体声声场的装置的框图; 图7示出了用于实现本专利技术的示例实施例的用户终端的框图;以及 图8示出了用于实施本专利技术的示例实施例的系统的框图。 贯穿所有附图,相同或相似的参考标号指示相同或相似的元素。 【具体实施方式】 总体上,本专利技术的实施例提供用于生成环绕立体声声场的方法、装置和计算机程 序产品。根据本专利技术的实施例,环绕立体声声场可以通过使用音频捕获设备(诸如终端用 户的移动电话)的自组织网络而被有效和准确地生成。下面将详细描述本专利技术的某些实施 例。 首先参考图1,其示出了本专利技术的实施例可实现于其中的系统100的框图。在图1 中,系统100包括多个音频捕获设备101以及服务器102。根据本专利技术的实施例,除了其他 功能之外,音频捕获设备101,能够捕获、记录和/或处理音频信号。音频捕获设备101的示 例可以包括但不限于移动电话、个人数字助理(PDA)、膝上型计算机、平板式计算机、个人计 算机(PC)或任何配备有音频捕获功能的其他适当的用户终端。例如,可以购得的移动电话 通常都配备至少一个麦克风,因此可以充当音频捕获设备101。 根据本专利技术的实施例,音频捕获设备101可以被布置在一个或多个自组织网络或 组103中,每个自组织网络103可以包括一个或多个音频捕获设备。音频捕获设备可以按 照预定义的策略被分组, 或者被动态地分组,将在下文详述。不同组可以位于相同或不同的物理位置。在 每个组内,音频捕获设备位于相同的物理位置并且可以彼此接近地放置。 图2A-图2C示出了包括三个音频捕获设备的组的某些示例。在图2A-图2C中 示出的示例实施例中,音频捕获设备101可以是移动电话、PDA或任何其他的便携式用户终 端,其配备了用于捕获音频信号的音频捕获元件201,诸如一个或多个麦克风。特别地,在图 2C中示出的示例实施例中,音频捕获设备101还配备有视频捕获元件202,诸如照相机,以 使得音频捕获设备101可以被配置为在捕获音频信号的同时捕获视频和/或图像。 应当注意,一个组内的音频捕获设备的数目不限于三个。相反,任何合适数目的音 频捕获设备都可以被安排进组。此外,在一个组内,多个音频捕获设备可以被安排成任何期 望的拓扑。在某些实施例中,组内的音频捕获设备可以借助于计算机网络、蓝牙、红外线、电 信等彼此通信,这里仅仅是几个例子。 继续参考图1,如图所示,服务器102经由网络连接可通信地连接至音频捕获设备 101的组。音频捕获设备101和服务器102例如可以通过计算机网络,诸如局域网(LAN)、 广域网(WAN)或因特网、通信网络、近场通信连接或其任何组合而彼此通信。本专利技术的 范围在此方面不受限制。 在操作中,环绕立体声声场的生成可以由音频捕获设备101或者由服务器102发 起。特别地,在某些实施例中,音频捕获设备101可以登录到服务器102并且请求服务器 102生成环绕立体声声场。然后,发送请求的音频捕获设备101将变成主设备,它向其他捕 获设备发送邀请,以邀请其他捕获设备加入音频捕获会话。在此方面,可能存在主设备所属 的预定的组。在这些实施例中,该组内的其他音频捕获设备接收来自主设备的邀请并且加 入音频捕获会话。备选地或附加地,另外一个或多个音频捕获设备可以被动态地识别并且 与主设备分组在一起。例如,在GPS(全球定位服务)之类的定位服务可用于音频捕获设备 101的情况下,可以自动地邀请与主设备邻近的一个或多个音频捕获设备加入音频捕获组。 在某些备选实施例中,对音频捕获设备的发现和分组也可以由服务器102执行。 在形成音频捕获设备的组之后,服务器102向该组内的所有音频捕获设备发送捕 获命令。备选地,捕获本文档来自技高网...

【技术保护点】
一种用于生成环绕立体声声场的方法,所述方法包括:接收由多个音频捕获设备捕获的音频信号;估计所述多个音频捕获设备的拓扑;以及至少部分地基于估计的所述拓扑,从接收的所述音频信号生成所述环绕立体声声场。

【技术特征摘要】
1. 一种用于生成环绕立体声声场的方法,所述方法包括: 接收由多个音频捕获设备捕获的音频信号; 估计所述多个音频捕获设备的拓扑;以及 至少部分地基于估计的所述拓扑,从接收的所述音频信号生成所述环绕立体声声场。2. 根据权利要求1所述的方法,其中估计所述多个音频捕获设备的所述拓扑包括: 获取所述多个音频捕获设备中的每对音频捕获设备之间的距离;以及 通过对获取的所述距离执行多维定标MDS分析来估计所述拓扑。3. 根据任意前述权利要求所述的方法,其中生成所述环绕立体声声场包括: 基于所述多个音频捕获设备的数目来选择用于处理所述音频信号的模式。4. 根据任意前述权利要求所述的方法,其中生成所述环绕立体声声场包括: 确定与所述多个音频捕获设备的估计的所述拓扑相匹配的拓扑模板; 至少部分地基于确定的所述拓扑模板来选择用于所述音频信号的权重;以及 使用选择的所述权重来处理所述音频信号以生成所述环绕立体声声场。5. 根据权利要求4所述的方法,其中选择所述权重包括: 基于确定的所述拓扑模板和所述音频信号的频率来选择所述权重。6. 根据任意前述权利要求所述的方法,还包括: 对接收的所述音频信号执行时间对齐。7. 根据权利要求6所述的方法,其中执行所述时间对齐包括应用基于协议的时钟同步 处理、端对端时钟同步处理和互相关处理中的至少一个。8. 根据任意前述权利要求所述的方法,还包括: 估计生成的所述环绕立体声声场相对于渲染设备的波达方向DOA ;以及 至少部分地基于估计的所述DOA来旋转生成的所述环绕立体声声场。9. 根据权利要求8所述的方法,其中旋转生成的所述环绕立体声声场包括: 基于估计的所述DOA和生成的所述环绕立体声声场的能量,旋转生成的所述环绕立体 声声场。10. 根据任意前述权利要求所述的方法,还包括: 将生成的所述环绕立体声声场转换为用于在渲染设备上回放的目标格式。11. 一种用于生成环绕立体声声场的装置,所述装置包括: 接收单元,被配置为接收由多个音频捕获设备捕获的音频信号; 拓扑估计单元,被配置为估计所述多个音频捕获设备的拓扑;以及 生成单元,被配置为至少部分地基于估计的所述拓扑而从接收的所述音频...

【专利技术属性】
技术研发人员:孙学京程斌徐森双志伟王珺
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1