高效的头部相关滤波器生成制造技术

技术编号：37041501 阅读：24 留言：0更新日期：2023-03-29 19:20

提供了一种用于生成用于音频渲染的头部相关(HR)滤波器的方法。该方法包括：生成指示HR滤波器模型的HR滤波器模型数据；以及基于所生成的HR滤波器模型数据，(i)对一个或多个基函数进行采样以及(ii)生成第一基函数形状数据和形状元数据。该方法还包括：提供所生成的第一基函数形状数据和形状元数据以存储在一个或多个存储介质中。个或多个存储介质中。个或多个存储介质中。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】高效的头部相关滤波器生成

[0001]公开了与用于高效的头部相关滤波器生成的方法和系统相关的实施例。

技术介绍

[0002]人类听觉系统配备有可以捕捉向听者传播的声(音频)波的两只耳朵。在本公开中，词“声音”和词“音频”可互换使用。图1示出了从由球坐标系中的一对仰角和方位角指定的到达方向(DOA)朝向听者传播的声波。在朝向听者的传播路径上，每个声波在到达听者的左耳膜和右耳膜之前与听者的上躯干、头部、外耳、以及围绕听者的物质相互作用。这种相互作用导致到达左耳膜和右耳膜的声音波形的时间和频谱变化，其中一些是DOA相关的。人类听觉系统已经学会解释这些变化来推断声波本身的各种空间特性以及听者发现自己所在的声学环境。该能力被称为空间听觉，其涉及听者如何评估嵌入在双耳信号(即，左右耳道中的声音信号)中的空间线索以推断由声音事件(物理声源)引起的听觉事件的位置和由听者所在的物理环境(例如，小房间、瓷砖浴室、礼堂、洞穴)引起的声学特性。通过重新引入双耳信号中的将导致对声音的空间感知的空间线索，可以反过来利用该人类能力(即，空间听觉)来创建空间音频场景。
[0003]主要的空间线索包括(1)角度相关的线索：双耳线索(即耳间声强差(ILD)和耳间时间差(ITD))和单耳(或频谱)线索；以及(2)距离相关的线索：强度和直接混响(D/R)能量比。波形的短时间(例如，1至5毫秒)DOA相关或角度相关的时间和频谱变化的数学表示是所谓的头部相关(HR)滤波器。HR滤波器的频域(FD)表示是所谓的头部相关传递函数(HRTF)，并且HR滤波器...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于生成用于音频渲染的头部相关HR滤波器的方法(1100)，所述方法包括：生成(s1102)指示HR滤波器模型的HR滤波器模型数据，其中，生成所述HR滤波器模型数据包括：选择一个或多个基函数的至少一个集合；基于所生成的HR滤波器模型数据，(i)对所述一个或多个基函数进行采样(s1104)以及(ii)生成(s1106)第一基函数形状数据和形状元数据，其中，所述第一基函数形状数据标识所述一个或多个基函数的一个或多个紧凑表示，并且所述形状元数据包括关于与所述一个或多个基函数相关的所述一个或多个紧凑表示的结构的信息；以及提供(s1108)所生成的第一基函数形状数据和形状元数据以存储在一个或多个存储介质中。2.根据权利要求1所述的方法，所述方法还包括：检测(s1110)触发事件的发生；以及作为检测到所述触发事件的发生的结果，输出(s1112)用于所述音频渲染的第二基函数形状数据和所述形状元数据。3.根据权利要求1或2所述的方法，其中，一个或多个基函数的所述至少一个集合被选择为使得满足以下条件中的任何一个或组合：(i)一个或多个基函数的所述至少一个集合在建模范围内是周期性的；(ii)所述至少一个集合中包括的至少一个基函数在所述建模范围内包括的一个或多个段中为零值；(iii)所述至少一个集合中包括的至多N个基函数在所述建模范围内包括的段中为非零，其中，N是正整数且小于所述至少一个集合中包括的基函数的总数；以及(iv)所述一个或多个基函数的至少一个非零部分是以下中的任何一个或组合：(1)相对于所述一个或多个基函数的另一非零部分是对称的或镜像的或(2)所述一个或多个基函数的另一非零部分的子采样版本。4.根据权利要求1至3中任一项所述的方法，其中，所述一个或多个基函数的紧凑表示指示所述一个或多个基函数的非零部分的形状，以及所述一个或多个基函数的所述非零部分的形状相对于所述一个或多个基函数的另一非零部分的形状是对称的或镜像的。5.根据权利要求1至4中任一项所述的方法，其中，所述形状元数据包括以下信息中的任何一个或组合：(i)基函数的数量；(ii)每个基函数的起点；(iii)一个或多个形状索引，每个形状索引标识用于音频渲染的特定形状；(iv)针对一个或多个基函数的形状重采样因子；(v)针对一个或多个基函数的翻转指示符，其中，所述翻转指示符指示是否获得所述一个或多个存储介质中存储的所述一个或多个基函数的所述一个或多个紧凑表示的翻转版本；(vi)基函数结构，以及(vii)每个基函数的非零部分的宽度。
6.根据权利要求1至5中任一项所述的方法，还包括：提供附加的HR滤波器模型参数以存储在所述一个或多个存储介质中。7.根据权利要求1至6中任一项所述的方法，其中，所述方法在触发所述音频渲染的事件的发生之前由预处理器执行。8.根据权利要求1至7中任一项所述的方法，其中，所述方法由网络实体中包括的预处理器执行，所述网络实体与音频渲染器是分离且不同的。9.根据权利要求1至8中任一项所述的方法，其中，所述第二基函数形状数据和所述形状元数据用于生成所述HR滤波器。10.根据权利要求1至9中任一项所述的方法，其中，所述第一基函数形状数据和所述第二基函数形状数据相同。11.根据权利要求1至9中任一项所述的方法，其中，所述第二基函数形状数据标识所述一个或多个基函数的所述一个或多个紧凑表示的转换版本，以及所述一个或多个基函数的所述一个或多个紧凑表示的转换版本是所述一个或多个基函数的所述一个或多个紧凑表示的对称或镜像版本和/或子采样版本。12.一种用于生成用于音频渲染的头部相关HR滤波器的方法(1200)，所述方法包括：获得(s1202)形状元数据，所述形状元数据指示是否获得一个或多个基函数的一个或多个紧凑表示的转换版本；获得(s1204)基函数形状数据，所述基函数形状数据标识(i)所述一个或多个基函数的所述一个或多个紧凑表示或(ii)所述一个或多个基函数的所述一个或多个紧凑表示的转换版本；以及基于所获得的形状元数据和所获得的基函数形状数据，通过使用(i)所述一个或多个基函数的所述一个或多个紧凑表示或(ii)所述一个或多个基函数的所述一个或多个紧凑表示的转换版本来生成(s1206)所述HR滤波器。13.根据权利要求12所述的方法，所述方法还包括：在获得指示如何获得所述一个或多个基函数的所述一个或多个紧凑表示的转换版本的所述形状元数据之后，从存储介质获得与所述一个或多个基函数的所述一个或多个紧凑表示相对应的数据，其中，所述数据是以预定义方式获得的，使得获得所述一个或多个基函数的所述一个或多个紧凑表示的转换版本。14.根据权利要求12所述的方法，所述方法包括：接收标识所述一个或多个基函数的所述一个或多个紧凑表示的数据；以及提供所接收的数据以存储在存储介质中，其中，获得标识所述一个或多个基函数的所述一个或多个紧凑表示的转换版本的基函数形状数据包括：以预定义方式从所述存储介质读取所存储的数据。15.根据权利要求12至14中任一项所述的方法，其中，所述一个或多个基函数的所述一个或多个紧凑表示的转换版本是所述一个或多个基函数的所述一个或多个紧凑表示的对称或镜像版本和/或子采样版本。16.根据权利要求13至15中任一项所述的方法，其中，以所述预定义方式获得所述数据
包括：(i)以预定义顺序获得所述数据和/或(ii)部分地获得所述数据。17.根据权利要求12至16中任一项所述的方法，所述方法还包括：获得...

【专利技术属性】
技术研发人员：托马斯，
申请(专利权)人：瑞典爱立信有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人