信息处理装置、信息处理方法和计算机可访问介质制造方法及图纸

技术编号：38943478 阅读：42 留言：0更新日期：2023-09-25 09:41

本公开涉及一种信息处理装置、信息处理方法和计算机可访问介质。该信息处理装置(100)包括：获取单元(141)，其获取包括用户的耳朵的图像的第一图像；以及计算单元(142)，其基于由获取单元(141)获取的第一图像，使用学习模型来计算与用户相对应的头部相关传递函数，该学习模型已经学习以在输入包括耳朵的图像的图像时输出与耳朵相对应的头部相关传递函数。像时输出与耳朵相对应的头部相关传递函数。像时输出与耳朵相对应的头部相关传递函数。

全部详细技术资料下载

【技术实现步骤摘要】
信息处理装置、信息处理方法和计算机可访问介质
[0001]本申请是专利技术名称为“信息处理装置、信息处理方法和信息处理程序”、申请日为2019年10月3日、申请号为201980065687.8的PCT国际申请进中国国家阶段申请的分案申请，PCT国际申请的国际申请号为、进入国家阶段日为2021年4月2日。

[0002]本公开涉及信息处理装置、信息处理方法和信息处理程序。具体地，本公开涉及头部相关传递函数计算处理。

技术介绍

[0003]已经使用通过使用数学上表达声音如何从声源传播到耳朵的头部相关传递函数(在下文中也称为HRTF)在耳机等处立体地再现音频图像的技术。
[0004]头部相关传递函数在个体之间有很大不同，并且因此期望使用当使用头部相关传递函数时为每个个体生成的头部相关传递函数。例如，已知基于通过捕获用户的耳廓而获得的图像来生成头部的三维数字模型(在下文中称为“3D模型”)，并且基于所生成的3D模型计算用户的头部相关传递函数的技术。
[0005]引用列表
[0006]专利文献
[0007]专利文献1：美国专利第9544706号。

技术实现思路

[0008]技术问题
[0009]根据常规技术，可以在信息处理中使用根据每个用户单独计算的头部相关传递函数，从而增加音频图像的平稳性。
[0010]然而，上述常规技术基于由用户捕获的图像来生成3D数字模型，并且基于所生成的模型来计算头部相关传递函数，并且因此具有相对较大的计算处理负荷。因此，假设利用上...

【技术保护点】

【技术特征摘要】
1.一种信息处理装置，包括：获取单元，被配置为：获取包括用户的第一耳朵的第一图像；以及基于从包括所述用户的第一耳朵的所述第一图像获取的第一耳朵参数，使用一个或多个学习模型的输出来获取对应于所述用户的第一头部相关传递函数，所述一个或多个学习模型已经学习以输出与所述第一耳朵参数相对应的第一头部相关传递函数。2.根据权利要求1所述的信息处理装置，其中，所述一个或多个学习模型已经通过以下方式进行学习：学习包括第二耳朵的第二图像、第二耳朵参数和第二头部相关传递函数之间的关系。3.根据权利要求1所述的信息处理装置，其中，所述获取单元基于指示所获取的第一图像不适合用于获取第一头部相关传递函数的信息，而请求重新捕获包括所述用户的所述第一耳朵的所述第一图像。4.根据权利要求1所述的信息处理装置，其中，所述一个或多个学习模型已经通过以下方式进行学习：学习包括第二耳朵的第二图像和第二耳朵参数之间的关系；利用包括与所述第二耳朵参数相对应的所述第二耳朵的头部的三维数据执行声学模拟：根据通过所述声学模拟获得的数据来计算第二头部相关传递函数；以及学习所述第二头部相关传递函数与所述第二耳朵参数之间的关系。5.一种信息处理方法，包括：获取包括用户的第一耳朵的第一图像；以及...

【专利技术属性】
技术研发人员：福田和巳，曲谷地哲，
申请(专利权)人：索尼集团公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人