【技术实现步骤摘要】
【国外来华专利技术】音频处理
[0001]本专利技术的示例和非限制性实施例涉及多通道音频信号的处理。特别地,本专利技术的各种实施例涉及基于多通道音频信号来获得波束成形音频信号。
技术介绍
[0002]多年来,诸如移动电话和平板计算机之类的移动设备已经配备了使设备的用户能够同时捕获音频和视频的相机和麦克风布置。随着麦克风技术的发展以及移动设备中可用的处理能力和存储容量的增加,为这种移动设备提供能够捕获多通道音频的多麦克风布置正变得越来越普遍,这反过来又能够将所捕获的多通道音频处理成空间音频以伴随同时捕获的视频。
[0003]通常,使用移动设备来捕获多通道音频信号的过程包括:操作在移动设备中布置的麦克风阵列以捕获多个麦克风信号;以及将所捕获的麦克风信号处理成记录的多通道音频信号,以用于在移动设备中进行进一步处理,用于与相关联的视频一起存储在移动设备中和/或发送到一个或多个其他设备。在典型场景中,移动设备的用户旨在记录多通道音频信号,该多通道音频信号表示与相机的视场(FOV)对应的音频场景,从而使能在捕获时对视听场景的全面呈现。
[0 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于音频聚焦的装置,所述装置包括至少一个处理器和包括计算机程序代码的至少一个存储器,所述计算机程序代码在由所述至少一个处理器执行时使所述装置:接收多通道音频信号,所述多通道音频信号表示在与图像的图像区域中的各位置对应的声音方向上的声音;接收与所述图像区域中的第一位置对应的音频焦点方向的指示;选择主声音方向,以使得它与所述图像区域中的第二位置相对应,所述第二位置在使其距离所述图像区域的中心点更远的方向上偏离所述第一位置;以及基于所述多通道音频信号,根据所选择的主声音方向,获得输出音频信号,其中,相对于在除了经由所选择的主声音方向定义的声音方向之外的声音方向上的声音,强调在经由所选择的主声音方向定义的声音方向上的声音。2.根据权利要求1所述的装置,其中,所述偏离的程度取决于所述第一位置在所述图像区域内的位置。3.根据权利要求2所述的装置,其中,所述偏离的所述程度随着与所述图像区域的所述中心点的距离的增加而增加。4.根据权利要求2或3所述的装置,其中,所述图像区域被划分成多个非重叠图像部分,并且所述偏离的所述程度取决于所述第一位置所位于的图像部分。5.根据权利要求1至4中任一项所述的装置,其中,所述偏离的方向是以下中的至少一个:取决于所述第一位置在图像区域内的位置;和/或沿着与所述第一位置和所述图像区域的所述中心点两者相交的概念线。6.根据权利要求5所述的装置,其中,所述图像区域被划分成多个非重叠图像部分,并且所述偏离的方向取决于所述第一位置所位于的图像部分。7.根据权利要求6所述的装置,其中,在由所述图像区域的单个边缘界定的图像部分中,所述偏离的方向是朝向所述图像区域的所述边缘,在由所述图像区域的两个非相对边缘界定的图像部分中,所述偏离的方向是朝向所述图像区域的所述非相对边缘中的至少一个,以及在未由所述图像区域的边缘界定的图像部分中,不应用偏离。8.根据权利要求1至7中任一项所述的装置,其中,被使得获得所述输出音频信号的所述装置包括被使得执行以下操作的装置:应用波束成形器以从所述多通道音频信号中提取表示在所述主声音方向上的声音的波束成形音频信号,并且其中,所述装置被使得根据所述第一位置在所述图像区域内的位置,选择波束成形器以用于获得所述输出音频信号的。9.根据权利要求8所述的装置,其中,被使得选择所述波束成形器的所述装置包括被使得执行以下操作的装置:响应于所述第一点距所述图像区域的所述中心点在预定义距离内,选择动态波束成形器;以及响应于所述第一点距所述图像区域的所述中心点比所述预定义距离更远,选择静态波束成形器。10.根据权利要求8所述的装置,其中,所述图像区域被划分成多个非重叠图像部分,并
且其中,所述装置被使得根据所述第一位置所位于的图像部分,选择所述波束成形器。11.根据权利要求10的装置,其中,所述装置被使得:针对由所述图像区域的单个边缘界定的图像部分和/或未由所述图像区域的边缘界定的图像部分,选择动态波束成形器;和/或针对由所述图像区域的两个非相对边缘界定的图像部分,选择静态波束成形器。12.根据权利要求9或11所述的装置,其中,所述静态波束成形器包括相移波束成形器,并且其中,所述动态波束成形器包括最小方差无失真响应波束成形器。13.一种用于音频聚焦的装置,所述装置包括至少一个处理器和包括计算机程序代码的至少一个存储器,所述计算机程序代码在由所述至少一个处理器执行时使所述装置:接收多通道音频信号,所述多通道音频信号表示在与图像的图像区域中的各位置对应的声音方向上的声音;接收与所述图像区域中的第一位置对应的音频焦点方向的指示;从多个不同的可用候选方向中选择主声音方向,其中,所述多个不同的可用候选方向包括所述音频焦点方向和一个或多个偏移候选方向,并且其中,每个偏移候选方向与偏离所述图像区域中的所述第一位置的相应候选偏移相对应;以及基于所述多通道音频信号,根据所选择的主声音方向,获得输出音频信号,其中,相对于在除了经由所选择的主声音方向定义的声音方向之外的声音方向上的声音,强调在经由所选择的主声音方向定义的声音方向上的声音。14.根据权利要求13所述的装置,其中,被使得选择所述主声音方向的所述装置包括被使得执行以下操作的装置:基于所述多通道音频信号,针对所述多个不同的可用候选方向中的每个可用候选方向,估计经由应用预定义波束成形器可获得的相应的候选波束成形音频信号的能量;基于所...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。