用于音频分析的装置和方法制造方法及图纸

技术编号：32146629 阅读：12 留言：0更新日期：2022-02-08 14:46

一种装置包括接收器(201)，其用于接收表示场景的音频的多通道音频信号。提取器(203)，其用于通过对多通道信号应用空间滤波来提取至少第一定向音频分量，其中空间滤波取决于多通道音频信号。特征处理器(205)确定第一定向音频分量的一组特征，并且分类器(207)响应于该组特征而从多个音频源类别中确定定向音频分量的第一音频源类别。分配器(209)从第一音频源类别的一组音频源属性中将第一音频源属性分配给第一定向音频分量。该装置可提供在多个通道信号中存在的各个音频源/分量的极为有利的分类和特征化。这对于例如音频事件的可视化是有利的。化是有利的。化是有利的。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于音频分析的装置和方法

[0001]本专利技术涉及一种用于音频分析的装置和方法，具体地但不排他地，涉及对例如视频游戏应用的音频分量进行分类。

技术介绍

[0002]近几十年来，音频应用和服务变得越来越复杂和多样化，尤其是提供各种不同的空间音频应用和体验已经变得司空见惯。
[0003]在许多视听体验和应用中，音频感知变得越来越重要，并且在许多情况下可能被认为很重要，甚至比视觉感知更重要。例如，在视频游戏应用中，尤其是在诸如第一人称射击(FPS)游戏之类的游戏中，用户必须同时使用视觉和听觉感官和感知来定位敌人、识别物体、检测爆炸等。音频场景传达对于准确定位游戏中的角色和对象非常有用的大量信息(例如指向不同声源的方向)。多通道音频允许进行空间音频表示，可以为用户提供更加身临其境的体验。然而，在许多实际场景中，用户可能无法访问多通道渲染系统，而限于渲染仅一个或两个通道(例如经由单个扬声器或立体声设置，例如经由耳机)，导致空间音频信息至少部分丢失。
[0004]在一些情况下，音频元素的特性可以被视觉地表示。例如，WO2010/075634A1中已经描述了声音事件可视化系统。这种方法可以显示视觉信息，例如表示不同类型声音的图标。然而，呈现的信息量往往是有限的，增强这些信息以提供更多信息或提供更准确或可靠的信息将是有益的。
[0005]诸如上述声音事件可视化系统之类的应用受益于被提供表征音频元素的信息，并且具体地通过被提供与各个声音元素相关联的声源的信息而受益。然而，从其中不同的声音元素和音频源被组合成单...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种装置，包括：接收器(201)，其用于接收表示场景的音频的多通道音频信号；提取器(203)，其用于通过对所述多通道信号应用空间滤波来提取至少第一定向音频分量，所述空间滤波取决于所述多通道音频信号；特征处理器(205)，其用于确定所述第一定向音频分量的一组特征；分类器(207)，其用于响应于所述一组特征而从多个音频源类别中确定所述第一定向音频分量的第一音频源类别，所述多个音频源类别中的每个音频源类别与一组一个或多个音频源属性关联；以及分配器(209)，其用于从与所述第一音频源类别关联的一组一个或多个音频源属性中将第一音频源属性分配给所述第一定向音频分量，其中所述提取器(203)包括：分频器(301)，其用于将所述多通道音频信号的音频通道信号划分为多个频率区间信号分量；方向估计器(303)，其用于确定所述多个频率区间信号分量中的每个频率区间信号分量的方向；分组器(305)，其响应于每个频率区间信号分量的所述方向而将频率区间信号分量分为多个组；以及生成器(307)，其用于通过组合一组频率区间信号分量的所述频率区间信号分量来生成所述第一定向音频分量。2.根据前述权利要求中任一项所述的装置，还包括用于生成所述场景的图像的图像生成器(105)；并且其中所述图像生成器(105)被布置为在所述图像中包括图形元素，所述图形元素的属性取决于所述第一音频源属性。3.根据权利要求2所述的装置，其中所述提取器(203)被布置为生成对所述第一定向音频分量的方向估计，并且所述图像生成器(105)被布置为响应于对所述第一定向音频分量的所述方向估计而确定所述图形元素在所述图像中的位置。4.根据权利要求2所述的装置，其中所述提取器(203)被布置为生成对所述第一定向音频分量的方向估计，并且所述图形元素的属性取决于对所述第一定向音频分量的所述方向估计。5.根据权利要求2至4中任一项所述的装置，其中所述图形元素取决于所述一组特征中的至少一个特征。6.根据前述权利要求中任一项所述的装置，还包括用于根据所述多通道音频信号生成输出音频信号的音频处理器(401)，所述音频处理器(401)被布置为响应于所述第一音频源属性而改变所述多通道音频信号的处理。7.根据权利要求6所述的装置，其中所述音频处理器(401)被布置为响应于所述第一音频源属性而改变所述输出音频信号中的所述第一定向音频分量的振幅和位置中的至少一个。8.根据权利要求6或7所述的装置，其中所述音频处理器(401)被布置为通过将频谱掩蔽应用于所述多通道音频信号来确定多个音频分...

【专利技术属性】
技术研发人员：马克西姆，
申请(专利权)人：斯蒂尔赛瑞斯法国公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人