基于声源方向性的心理声学增强制造技术

技术编号：38918733 阅读：44 留言：0更新日期：2023-09-25 09:31

一种设备包括：存储器，其被配置为存储与一个或多个输入音频信号相对应的一个或多个音频源的方向性数据。该设备还包括一个或多个处理器，其被配置为至少部分地基于方向性数据来确定一个或多个均衡器设置。一个或多个处理器还被配置为基于均衡器设置来生成与一个或多个输入音频信号的心理声学增强版本相对应的一个或多个输出音频信号。的一个或多个输出音频信号。的一个或多个输出音频信号。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】基于声源方向性的心理声学增强
与相关申请的交叉引用
[0001]本申请要求保护于2021年1月29日递交的共同所有的美国非临时专利申请No.17/162,241的优先权的权益，通过引用将所述申请的内容整体上明确地并入本文。

[0002]概括而言，本公开内容涉及基于音频源方向性的心理声学增强。

技术介绍

[0003]技术的进步已经导致更小且更强大的计算设备。例如，当前存在各种各样的便携式个人计算设备，包括小型、轻量级以及容易由用户携带的无线电话(诸如移动和智能电话、平板设备和膝上型计算机)。这些设备可以在无线网络上传送语音和数据分组。此外，许多这样的设备并入了额外的功能，诸如数字静止照相机、数字摄像机、数字记录器和音频文件播放器。此外，这样的设备可以处理可执行指令，包括可以用以接入互联网的软件应用(诸如网页浏览器应用)。照此，这些设备可以包括关键的计算能力。
[0004]这样的计算设备通常合并有从一个或多个麦克风接收音频信号的功能。例如，音频信号可以表示由麦克风捕获的用户语音、由麦克风捕获的环境声音或其组合。由于麦克风距其用户语音被麦克风捕获的用户的距离，用户语音可能难以在音频信号中听到。例如，距用户较远的麦克风可能捕获较多的环境声音，诸如交通、其他用户的语音等。作为另一示例，当被较远的麦克风捕获时，用户语音听起来更弱。关注音频信号中的特定声音的能力对于各种应用是有用的，诸如在通信应用或声控辅助系统中更清楚地传达用户语音。

技术实现思路

[0005]根据本公开内容的一种实现，一种...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种设备，包括：存储器，其被配置为存储与一个或多个输入音频信号相对应的一个或多个音频源的方向性数据；以及一个或多个处理器，其被配置为：至少部分地基于所述方向性数据来确定一个或多个均衡器设置；以及基于所述均衡器设置来生成与所述一个或多个输入音频信号的心理声学增强版本相对应的一个或多个输出音频信号。2.根据权利要求1所述的设备，其中，所述心理声学增强版本模仿在与音频变焦操作相关的变焦朝向和变焦距离处所述一个或多个音频源的频率响应。3.根据权利要求1所述的设备，其中，所述一个或多个处理器还被配置为：接收指示音频变焦操作的变焦目标的用户输入；以及基于所述变焦目标来确定所述一个或多个均衡器设置。4.根据权利要求3所述的设备，其中，所述变焦目标包括变焦位置、变焦距离、变焦朝向、对所述一个或多个音频源中的至少一者的选择、或其组合。5.根据权利要求1所述的设备，其中，所述一个或多个音频源中的特定音频源的所述方向性数据指示所述特定音频源的朝向和距离频率响应特性。6.根据权利要求1所述的设备，其中，所述一个或多个处理器还被配置为：对所述一个或多个输入音频信号执行波束成形，以生成一个或多个经波束成形的音频信号；以及处理基于所述一个或多个经波束成形的音频信号的均衡器输入音频信号以生成所述一个或多个输出音频信号。7.根据权利要求1所述的设备，其中，所述一个或多个处理器还被配置为：识别基于所述一个或多个输入音频信号的语音检测输入音频信号中的语音，以生成一个或多个语音音频信号；以及处理基于所述一个或多个语音音频信号的均衡器输入音频信号以生成所述一个或多个输出音频信号。8.根据权利要求1所述的设备，其中，所述一个或多个处理器还被配置为：基于变焦目标来将一个或多个增益应用于基于所述一个或多个输入音频信号的增益调整器输入音频信号，以生成经增益调整的音频信号；以及处理基于所述经增益调整的音频信号的均衡器输入音频信号以生成所述一个或多个输出音频信号。9.根据权利要求1所述的设备，其中，所述一个或多个处理器还被配置为：对基于所述一个或多个输入音频信号的噪声抑制器输入音频信号执行噪声抑制，以生成经噪声抑制的音频信号；以及处理基于所述经噪声抑制的音频信号的均衡器输入音频信号以生成所述一个或多个输出音频信号。10.根据权利要求1所述的设备，其中，所述一个或多个处理器还被配置为：处理基于所述一个或多个输入音频信号的上下文检测器输入音频信号，以生成所述一个或多个音频源的上下文数据，其中，所述一个或多个音频源中的特定音频源的所述上下
文数据指示所述特定音频源的朝向、所述特定音频源的距离、所述特定音频源的类型或其组合；以及基于所述特定音频源的所述类型来获得所述特定音频源的所述方向性数据。11.根据权利要求10所述的设备，其中，所述一个或多个处理器还被配置为：至少部分地基于与所述一个或多个输入音频信号相关联的图像数据来生成所述上下文数据。12.根据权利要求11所述的设备，其中，所述一个或多个处理器还被配置为：从存储器检索所述图像数据和所述一个或多个输入音频信号。13.根据权利要求11所述的设备，还包括：一个或多个麦克风，其耦合到所述一个或多个处理器，并且被配置为生成所述一个或多个输入音频信号。14.根据权利要求11所述的设备，还包括：相机，其耦合到所述一个或多个处理器，并且被配置为生成所述图像数据。15.根据权利要求11所述的设备，其中，所述一个或多个处理器还被配置为：基于所述一个或多个输入音频信号、所述图像数据或两者执行音频源识别，以识别所述一个或多个音频源中的所述特定音频源的所述类型。16.根据权利要求11所述的设备，其中，所述一个或多个处理器还被配置为：基于所述一个或多个输入音频信号、所述图像数据或两者执行音频源识别，以确定所述一个或多个音频源中的所述特定音频源；以及对所述图像数据执行图像分析以确定所述特定音频源的所述朝向。17.根据权利要求11所述的设备，其中，所述一个或多个处理器还被配置为：基于所述一个或多个输入音频信号、所述图像数据或两者执行音频源识别，以确定所述一个或多个音频源中的所述特定音频源；以及对所述一个或多个输入音频信号、所述图像数据或两者执行距离分析，以确定所述特定音频源的所述距离。18.根据权利要求10所述的设备，其中，所述一个或多个处理器还被配置为：基于均衡器设置数据来选择所述一个或多个均衡器设置，所述均衡器设置数据将所述一个或多个均衡器设置与所述上下文数据、所述方向性数据、变焦朝向、变焦距离或其组合进行关联。19.根据权利要求18所述的设备，其中，所述一...

【专利技术属性】
技术研发人员：I，
申请(专利权)人：高通股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人