基于声源方向性的心理声学增强制造技术

技术编号:38918733 阅读:44 留言:0更新日期:2023-09-25 09:31
一种设备包括:存储器,其被配置为存储与一个或多个输入音频信号相对应的一个或多个音频源的方向性数据。该设备还包括一个或多个处理器,其被配置为至少部分地基于方向性数据来确定一个或多个均衡器设置。一个或多个处理器还被配置为基于均衡器设置来生成与一个或多个输入音频信号的心理声学增强版本相对应的一个或多个输出音频信号。的一个或多个输出音频信号。的一个或多个输出音频信号。

【技术实现步骤摘要】
【国外来华专利技术】基于声源方向性的心理声学增强
与相关申请的交叉引用
[0001]本申请要求保护于2021年1月29日递交的共同所有的美国非临时专利申请No.17/162,241的优先权的权益,通过引用将所述申请的内容整体上明确地并入本文。


[0002]概括而言,本公开内容涉及基于音频源方向性的心理声学增强。

技术介绍

[0003]技术的进步已经导致更小且更强大的计算设备。例如,当前存在各种各样的便携式个人计算设备,包括小型、轻量级以及容易由用户携带的无线电话(诸如移动和智能电话、平板设备和膝上型计算机)。这些设备可以在无线网络上传送语音和数据分组。此外,许多这样的设备并入了额外的功能,诸如数字静止照相机、数字摄像机、数字记录器和音频文件播放器。此外,这样的设备可以处理可执行指令,包括可以用以接入互联网的软件应用(诸如网页浏览器应用)。照此,这些设备可以包括关键的计算能力。
[0004]这样的计算设备通常合并有从一个或多个麦克风接收音频信号的功能。例如,音频信号可以表示由麦克风捕获的用户语音、由麦克风捕获的环境声音或其组合。由于麦克风距其用户语音被麦克风捕获的用户的距离,用户语音可能难以在音频信号中听到。例如,距用户较远的麦克风可能捕获较多的环境声音,诸如交通、其他用户的语音等。作为另一示例,当被较远的麦克风捕获时,用户语音听起来更弱。关注音频信号中的特定声音的能力对于各种应用是有用的,诸如在通信应用或声控辅助系统中更清楚地传达用户语音。

技术实现思路

[0005]根据本公开内容的一种实现,一种设备包括:存储器,其被配置为存储与一个或多个输入音频信号相对应的一个或多个音频源的方向性数据。所述设备还包括一个或多个处理器,其被配置为:至少部分地基于所述方向性数据来确定一个或多个均衡器设置。所述一个或多个处理器还被配置为:基于所述均衡器设置来生成与所述一个或多个输入音频信号的心理声学增强版本相对应的一个或多个输出音频信号。
[0006]根据本公开内容的另一种实现,一种方法包括:在设备处获得与一个或多个输入音频信号相对应的一个或多个音频源的方向性数据。所述方法还包括:在所述设备处,至少部分地基于所述方向性数据来确定一个或多个均衡器设置。所述方法还包括:基于所述均衡器设置来生成与所述一个或多个输入音频信号的心理声学增强版本相对应的一个或多个输出音频信号。
[0007]根据本公开内容的另一种实现,一种非暂时性计算机可读介质存储指令,所述指令在由一个或多个处理器执行时使得所述一个或多个处理器进行以下操作:获得与一个或多个输入音频信号相对应的一个或多个音频源的方向性数据。所述指令在由一个或多个处理器执行时还使得所述一个或多个处理器进行以下操作:至少部分地基于所述方向性数据
来确定一个或多个均衡器设置。所述指令在由一个或多个处理器执行时还使得所述一个或多个处理器进行以下操作:基于所述均衡器设置来生成与所述一个或多个输入音频信号的心理声学增强版本相对应的一个或多个输出音频信号。
[0008]根据本公开内容的另一种实现,一种装置包括:用于获得与一个或多个输入音频信号相对应的一个或多个音频源的方向性数据的单元。所述装置还包括:用于至少部分地基于所述方向性数据来确定一个或多个均衡器设置的单元。所述装置还包括:用于基于所述均衡器设置来生成与所述一个或多个输入音频信号的心理声学增强版本相对应的一个或多个输出音频信号的单元。
[0009]在阅读整个申请(包括以下章节:附图说明、具体实施方式和权利要求书)之后,本公开内容的其它方面、优势和特征将变得显而易见。
附图说明
[0010]图1是根据本公开内容的一些示例的可操作性以基于音频源方向性来执行心理声学增强的系统的特定说明性方面的框图。
[0011]图2A是根据本公开内容的一些示例的由图1的系统生成的图形用户界面(GUI)的说明性示例的图。
[0012]图2B是根据本公开内容的一些示例的由图1的系统生成的GUI的另一说明性示例的图。
[0013]图3是根据本公开内容的一些示例的图1的系统的组件的说明性方面的图。
[0014]图4是根据本公开内容的一些示例的图1的系统的组件的说明性方面的图。
[0015]图5是根据本公开内容的一些示例的图1的系统的组件的说明性方面的图。
[0016]图6是根据本公开内容的一些示例的图1的系统的组件的说明性方面的图。
[0017]图7示出了根据本公开内容的一些示例的可操作以基于音频源方向性来执行心理声学增强的集成电路的示例。
[0018]图8是根据本公开内容的一些示例的可操作以基于音频源方向性来执行心理声学增强的移动设备的图。
[0019]图9是根据本公开内容的一些示例的可操作以基于音频源方向性来执行心理声学增强的耳机的图。
[0020]图10是根据本公开内容的一些示例的可操作以基于音频源方向性来执行心理声学增强的可穿戴电子设备的图。
[0021]图11是根据本公开内容的一些示例的可操作以基于音频源方向性来执行心理声学增强的声控扬声器系统的图。
[0022]图12是根据本公开内容的一些示例的可操作以基于音频源方向性来执行心理声学增强的相机的图。
[0023]图13是根据本公开内容的一些示例的可操作以基于音频源方向性来执行心理声学增强的耳机(诸如虚拟现实或增强现实耳机)的图。
[0024]图14是根据本公开内容的一些示例的可操作以基于音频源方向性来执行心理声学增强的车辆的第一示例的图。
[0025]图15是根据本公开内容的一些示例的可操作以基于音频源方向性来执行心理声
学增强的车辆的第二示例的图。
[0026]图16是根据本公开内容的一些示例的可以由图1的设备执行的基于音频源方向性的心理声学增强的方法的特定实现的图。
[0027]图17是根据本公开内容的一些示例的可操作以基于音频源方向性来执行心理声学增强的设备的特定说明性示例的框图。
具体实施方式
[0028]麦克风生成表示所捕获的声音的音频信号,诸如用户语音、环境声音或其组合。由于麦克风距音频源的距离,各种声音可能难以在音频信号中听到。聚焦于音频信号中的特定声音的能力对于各种应用是有用的,诸如通信应用中的用户语音或鸟类跟踪应用中的鸟类声音。
[0029]公开了基于音频源方向性的心理声学增强的系统和方法。不同类型的音频源可以具有不同的声音方向性特性。例如,人类语音更多地定向在人类头部的前方而不是后方,并且可能表现出基于人类讲话者面对的距离以及与该方向的角度偏移而变化的频率响应,而十二面体声源近似于全向方向性。
[0030]音频增强器基于音频源的方向性来执行心理声学增强,以近似通过相对于音频源(例如,靠近或远离)移动麦克风而捕获的声音。例如,音频增强器包括方向性分析器和均衡器。方向性分析器基于音频源和变焦目标的方向性数据来生成均衡器设置。例如,方向性分析器生成均衡器设置,使得应用均衡器设置调整特定音频频率的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种设备,包括:存储器,其被配置为存储与一个或多个输入音频信号相对应的一个或多个音频源的方向性数据;以及一个或多个处理器,其被配置为:至少部分地基于所述方向性数据来确定一个或多个均衡器设置;以及基于所述均衡器设置来生成与所述一个或多个输入音频信号的心理声学增强版本相对应的一个或多个输出音频信号。2.根据权利要求1所述的设备,其中,所述心理声学增强版本模仿在与音频变焦操作相关的变焦朝向和变焦距离处所述一个或多个音频源的频率响应。3.根据权利要求1所述的设备,其中,所述一个或多个处理器还被配置为:接收指示音频变焦操作的变焦目标的用户输入;以及基于所述变焦目标来确定所述一个或多个均衡器设置。4.根据权利要求3所述的设备,其中,所述变焦目标包括变焦位置、变焦距离、变焦朝向、对所述一个或多个音频源中的至少一者的选择、或其组合。5.根据权利要求1所述的设备,其中,所述一个或多个音频源中的特定音频源的所述方向性数据指示所述特定音频源的朝向和距离频率响应特性。6.根据权利要求1所述的设备,其中,所述一个或多个处理器还被配置为:对所述一个或多个输入音频信号执行波束成形,以生成一个或多个经波束成形的音频信号;以及处理基于所述一个或多个经波束成形的音频信号的均衡器输入音频信号以生成所述一个或多个输出音频信号。7.根据权利要求1所述的设备,其中,所述一个或多个处理器还被配置为:识别基于所述一个或多个输入音频信号的语音检测输入音频信号中的语音,以生成一个或多个语音音频信号;以及处理基于所述一个或多个语音音频信号的均衡器输入音频信号以生成所述一个或多个输出音频信号。8.根据权利要求1所述的设备,其中,所述一个或多个处理器还被配置为:基于变焦目标来将一个或多个增益应用于基于所述一个或多个输入音频信号的增益调整器输入音频信号,以生成经增益调整的音频信号;以及处理基于所述经增益调整的音频信号的均衡器输入音频信号以生成所述一个或多个输出音频信号。9.根据权利要求1所述的设备,其中,所述一个或多个处理器还被配置为:对基于所述一个或多个输入音频信号的噪声抑制器输入音频信号执行噪声抑制,以生成经噪声抑制的音频信号;以及处理基于所述经噪声抑制的音频信号的均衡器输入音频信号以生成所述一个或多个输出音频信号。10.根据权利要求1所述的设备,其中,所述一个或多个处理器还被配置为:处理基于所述一个或多个输入音频信号的上下文检测器输入音频信号,以生成所述一个或多个音频源的上下文数据,其中,所述一个或多个音频源中的特定音频源的所述上下
文数据指示所述特定音频源的朝向、所述特定音频源的距离、所述特定音频源的类型或其组合;以及基于所述特定音频源的所述类型来获得所述特定音频源的所述方向性数据。11.根据权利要求10所述的设备,其中,所述一个或多个处理器还被配置为:至少部分地基于与所述一个或多个输入音频信号相关联的图像数据来生成所述上下文数据。12.根据权利要求11所述的设备,其中,所述一个或多个处理器还被配置为:从存储器检索所述图像数据和所述一个或多个输入音频信号。13.根据权利要求11所述的设备,还包括:一个或多个麦克风,其耦合到所述一个或多个处理器,并且被配置为生成所述一个或多个输入音频信号。14.根据权利要求11所述的设备,还包括:相机,其耦合到所述一个或多个处理器,并且被配置为生成所述图像数据。15.根据权利要求11所述的设备,其中,所述一个或多个处理器还被配置为:基于所述一个或多个输入音频信号、所述图像数据或两者执行音频源识别,以识别所述一个或多个音频源中的所述特定音频源的所述类型。16.根据权利要求11所述的设备,其中,所述一个或多个处理器还被配置为:基于所述一个或多个输入音频信号、所述图像数据或两者执行音频源识别,以确定所述一个或多个音频源中的所述特定音频源;以及对所述图像数据执行图像分析以确定所述特定音频源的所述朝向。17.根据权利要求11所述的设备,其中,所述一个或多个处理器还被配置为:基于所述一个或多个输入音频信号、所述图像数据或两者执行音频源识别,以确定所述一个或多个音频源中的所述特定音频源;以及对所述一个或多个输入音频信号、所述图像数据或两者执行距离分析,以确定所述特定音频源的所述距离。18.根据权利要求10所述的设备,其中,所述一个或多个处理器还被配置为:基于均衡器设置数据来选择所述一个或多个均衡器设置,所述均衡器设置数据将所述一个或多个均衡器设置与所述上下文数据、所述方向性数据、变焦朝向、变焦距离或其组合进行关联。19.根据权利要求18所述的设备,其中,所述一...

【专利技术属性】
技术研发人员:I
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1