经由光学捕获的个性化HRTFS制造技术

技术编号:27587890 阅读:77 留言:0更新日期:2021-03-10 10:04
一种产生个性化HRTF的设备及方法。所述系统通过计算针对HRTF的模型来准备,所述模型被描述为一组有限的实例输入数据,即针对一组个体的人体测量量度及人口统计信息,与一组对应输出数据,即,使用同一组个体的3D扫描的高分辨率数据库来数值模拟的HRTF之间的关系。在使用时,系统向用户查询其人口统计信息,且接着从所述用户的一系列图像,所述系统检测并测量各种人体测量特性。作为产生个性化HRTF的部分,所述系统接着将准备就绪的模型应用于所述人体测量及人口统计数据。以此方式,与通过执行所述用户的高分辨率扫描或声学测量相比,所述个性化HRTF可更便利地产生,并且与通过数值模拟其HRTF相比具有更小的计算复杂度。模拟其HRTF相比具有更小的计算复杂度。模拟其HRTF相比具有更小的计算复杂度。

【技术实现步骤摘要】
【国外来华专利技术】经由光学捕获的个性化HRTFS
[0001]相关申请案的交叉参考
[0002]本申请案主张2018年7月25日申请的针对“经由光学捕获的个性化HRTF的方法及设备(Method and Apparatus to Personalized HRTF via Optical Capture)”的第62/703,297号美国临时申请案的权益,所述申请案通过引用的方式并入本文中。


[0003]本专利技术涉及音频处理,并且特定来说,涉及根据收听者的人体测量及人口统计特性产生定制音频。

技术介绍

[0004]除非本文另外指出,否则此章节中描述的方法不是本申请案中的权利要求书的现有技术,并且由于包含在此章节中而不被承认是现有技术。
[0005]通过将声音放置在各种位置处并通过仿真头进行录音,可经由通过耳机回放此类录音来实现对来自相对于收听者的对应各种位置的声音的感知。如果使用独立扬声器而不是耳机,此方法有导致模糊的声音的不良副作用,因此通常将所述技术用于多轨录音的选定轨,而不是整个录音。为改进所述技术,仿真材料可包含耳朵(耳廓)的形状本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种产生头部相关传递函数HRTF的方法,所述方法包括:产生HRTF计算系统,其中产生所述HRTF计算系统包含:测量多个训练主体的多个3D扫描,通过对所述多个3D扫描执行声散射计算,产生针对所述多个训练主体的多个HRTF,收集所述多个训练主体的产生数据,及执行所述HRTF计算系统的训练,以将所述产生数据变换为所述多个HRTF;及使用所述HRTF计算系统产生针对用户的个性化HRTF,其中产生所述个性化HRTF包含:收集所述用户的产生数据,及将所述用户的所述产生数据输入到所述HRTF计算系统中以获得所述个性化HRTF。2.根据权利要求1所述的方法,其中执行所述训练包括使用具有套索正则化的线性回归。3.根据权利要求1到2中任一权利要求所述的方法,其中所述用户的所述产生数据包括人体测量及人口统计数据中的至少一者。4.根据权利要求3所述的方法,其中所述人体测量通过以下获得:收集所述用户的多个图像;及使用所述多个图像以确定所述人体测量。5.根据权利要求4所述的方法,其中使用所述多个图像以确定人体测量是使用卷积神经网络来执行的。6.根据权利要求4所述的方法,其进一步包括:使用所述用户的所述多个图像中的至少一个图像中的参考对象来缩放所述用户的所述人体测量。7.根据权利要求1到6中任一权利要求所述的方法,其进一步包括:通过将所述个性化HRTF应用于音频信号来产生音频输出。8.根据权利要求1到7中任一权利要求所述的方法,其进一步包括:通过服务器装置存储所述个性化HRTF;及通过所述服务器装置将所述个性化HRTF传输到用户装置,其中所述用户装置通过将所述个性化HRTF应用于音频信号来产生音频输出。9.根据权利要求1到8中任一权利要求所述的方法,其进一步包括:通过用户装置通过将所述个性化HRTF应用于音频信号来产生音频输出,其中所述用户装置包含头戴式耳机、一对耳塞及一对听觉器中的一者。10.根据权利要求1到9中任一权利要求所述的方法,其中音频信号包括包含位置信息的多个音频对象,所述方法进一步包括:通过将所述个性化HRTF应用于所述多个音频对象来产生双耳音频输出。11.一种非暂时性计算机可读媒体,其存储计算机程序,所述计算机程序在由处理器执行时控制设备以执行包含根据权利要求1到10中任一权利要求所述的方法的处理。12.一种用于产生头部相关传递函数HRTF的设备,所述设备包括:至少一个处理器;及至少一个存储器,其中所述至少一个处理器经配置以控制所述设备以产生HRTF计算系统,其中产生所述
HRTF计算系统包含:测量多个训练主体的多个3D扫描,通过对所述多个3D扫描执行声散射计算,产生针对所述多个训练主体的多个HRTF,收集所述多个训练主体的产生数据,及执行所述HRTF计算系统的训练,以将所述产生数据转换为所述多个HRTF;及其中所述至少一个处理器经配置以控制所述设备以使用所述HRTF计算系统产生针对用户的个性化HRTF,其中产生所述个性化HRTF包含:收集所述用户的产生数据,及将所述用户的所述产生数据输入到所述HRTF计算系统中以获得所述个性化HRTF。13.根据权利要求12所述的设备,其中所述用户的所述产生数据包括人体测量及人口统计数据中的至少一者,所述设备进一步包括:用户输入装置,其经配置以收集所述用户的多个图像,并且使用所述用户的所述多个图像以确定所述用户的所述人体测量,其中使用所述用户的所述多个图像中的至少一个图像中的参考对象来缩放所述用户的所述人体测量。14.根据权利要求12到13中任一权利要求所述的设备,其进一步包括:用户输出装置,其经配置以通过将所述个性化HRTF应用于音频信号来产生音频输出。15.根据权利要求12到14中任一权利要求所述的设备,其进一步包括:服务器装置,其经配置以产生所述HRTF计算系统,产生所述个性化HRTF,存储所述个性化HRTF以及将所述个性化HRTF传输到用户装置,其中所述用户装置经配置以通过将所述个性化HRTF应用于音频信号来产生音频输出。16.根据权利要求12到15中任一权利要求所述的设备,其进一步包括:用户装置,其经配置以通过将所述个性化HRTF应用于音频信号来产生音频输出,其中所述用户装置包含头戴式耳机、一对耳塞及一对听觉器中的一者。17.根据权利要求12到16中任一权利要求所述的设备,其中音频信号包括包含位置信息的多个音频对象,且其中所述至少一个处理器经配置以控制所述设备以通过将所述个性化HRTF应用于所述多个音频对象来产生双耳音频输出。18.根据权利要求12到17中任一权利要求所述的设备,其进一步包括:服务器装置,其经配置以使用所述HRTF计算系统产生针对所述用户的所述个性化HRTF,其中所述服务器装置执行摄影测量组件、上下文变换组件、界标检测组件及人体测量组件,其中所述摄影测量组件经配置以接收所述用户的多个结构影像,并且使用根据运动的结构技术来产生多个相机变换及结构图像集,其中所述上下文变换组件经配置以接收多个相机变换及所述结构图像集,并且通过使用所述结构图像集平移及旋转所述多个相机变换来产生经变换多个相机变换,其中所述界标检测组件经配置以接收所述结构图像集及所述经变换多个相机变换,并且产生对应于使用所述结构图像集及所述经变换多个相机变换识别的所述用户的人体测量特征的3D界标集,其中所述人体测量组件经配置以接收所述3D界标集,并且从所述3D界标集产生人体测
量数据,其中所述人体测量数据对应于在所述3D界标集的个别界标之间测量的一组距离及角度,且其中所述服务器装置经配置以通过将所述人体测量数据输入到所述HRTF计算系统中来产生针对所述用户的所述个性化HRTF。19.根据权利要求12到18中任一权利要求所述的设备,其进一步包括:服务器装置,其经配置以使用所述HRTF计算系统产生针对所述用户的所述个性化HRTF,其中所述服务器装置执行比例测量组件,其中所述比例测量组件经配置以接收包含比例参考的图像的比例影像,并且产生同源度量,其中所述服务器装置经配置以使用所述同源度量来缩放所述用户的结构影像。20.根据权利要求12到19中任一权利要求所述的设备,其进一步包括:服务器装置,其经配置以使用所述HRTF计算系统产生针对所述用户的所述个性化HRTF,其中所述服务器装置执行界标检测组件、3D投影组件以及角度及距离测量组件,其中所述界标检测组件经配置以接收所述用户的人体测量界标的裁剪图像集,并且从所述经裁剪图像集产生所述用户的所述组人体测量界标的一组二维坐标,其中所述3D投影组件经配置以接收所述组2D坐标及多个相机变换,并且使用所述相机变换产生对应于3D空间中所述人体测量界标中的每一者的所述组2D组件的一组3D坐标,其中所述角度及距离测量组件经配置以接收所述组3D坐标,并且从所述组3D坐标产生人体测量数据,其中所述人体测量数据对应于所述组3D坐标中的所述人体测量界标的角度及距离,其中所述服务器装置经配置以通过将所述人体测量数据输入到所述HRTF计算系统中来产生针对所述用户的所述个性化HRTF。21.根据权利要求12到20中任一权利要求所述的设备,其中所述HRTF计算系统经配置以训练对应于左耳HRTF及右耳HRTF中的一者的模型,其中所述个性化HRTF是通过使用所述模型以产生左耳个性化HRTF及右耳个性化HRTF中的一者并且通过使用所述模型的反射以产生所述左耳个性化HRTF及所述右耳个性化HRTF中的另一者来产生的。22.根据权利要求12到21中任一权利要求所述的设备,其进一步包括:服务器装置,其经配置以使用所述HRTF计算系统产生针对所述用户的所述个性化HRTF,其中所述服务器装置执行数据编译组件,其中所述数据编译组件经配置以使用从所述产生数据的已知部分确定的估计来实施所述产生数据的适度降级以填充所述产生数据的缺失部分。23.根据...

【专利技术属性】
技术研发人员:M
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1