用于处理音频输入数据的方法及其设备和存储介质技术

技术编号：42304462 阅读：33 留言：0更新日期：2024-08-14 15:51

提出了用于处理音频输入数据的方法及其设备和存储介质。该计算机实现的方法，用于通过使用音频设备将音频输入数据处理成经处理的音频数据，该音频设备包括麦克风、处理器设备和保存多个神经网络的存储器。多个神经网络与不同的房间类型相关联，其中每个房间类型与一个或多个参考房间声学度量相关联。该方法包括：通过麦克风获得房间响应数据，其中房间响应数据反映放置音频设备的房间的房间声学；通过使用处理器设备，基于房间响应数据确定一个或多个房间声学度量；以及通过使用处理器设备，通过将一个或多个房间声学度量与与多个神经网络相关联的不同的房间类型相关联的一个或多个参考房间声学度量进行比较，在多个神经网络中选择匹配神经网络。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音频数据处理，有时称为音频信号处理。更具体地，本公开涉及一种通过考虑房间声学来处理音频数据的方法和设备。

技术介绍

1、如今，世界各地的人们每天都在使用智能扬声器、会议扬声器或其他音频设备与同事、商业伙伴、家人和朋友交流，听音乐、播客等，有时还使用虚拟助手呈现信息，例如，amazon.com公司提供的alexa或苹果公司提供的siri。这些音频设备通常配备有麦克风、扬声器、数据通信设备和数据处理设备。数据通信设备可以被布置成直接与外部服务器通信，这可以是例如汽车中的音频设备的情况，或者它可以被布置成经由网关与外部服务器通信，这可以是房屋中的智能扬声器的情况。数据通信设备还可以被布置成使得音频数据从计算机或移动电话传递到音频设备。例如，bluetoothtm扬声器可能就是这种情况。

2、这些音频设备中的许多具有配置用于提供高质量的声音体验的硬件和软件。例如，可以进行抑制噪声以提高语音清晰度。对于主要用于生成语音数据(即，包括语音的音频数据)的音频设备，例如，会议扬声器，抑制噪声的一种方式是简单地去除频率在人类语音...

【技术保护点】

1.一种计算机实现的方法，用于通过使用音频设备将音频输入数据处理成经处理的音频数据，所述音频设备包括麦克风、处理器设备和保存多个神经网络的存储器，其中，所述多个神经网络与不同的房间类型相关联，其中，每个房间类型与一个或多个参考房间声学度量相关联，所述方法包括：

2.根据权利要求1所述的方法，其中，所述一个或多个房间声学度量包括给定频带或一组频带的混响时间，例如RT60、直接混响比(DRR)和/或早期衰减时间(EDT)。

3.根据权利要求1所述的方法，其中，所述多个神经网络包括一般训练的神经网络，并且在通过将所述一个或多个房间声学度量与所述一个或多个参考房间声学度量...

【技术特征摘要】

2.根据权利要求1所述的方法，其中，所述一个或多个房间声学度量包括给定频带或一组频带的混响时间，例如rt60、直接混响比(drr)和/或早期衰减时间(edt)。

3.根据权利要求1所述的方法，其中，所述多个神经网络包括一般训练的神经网络，并且在通过将所述一个或多个房间声学度量与所述一个或多个参考房间声学度量进行比较而没有找到所述匹配神经网络的情况下，选择所述一般训练的神经网络作为所述匹配神经网络。

4.根据权利要求1所述的方法，其中，所述多个神经网络已经用不同的损失函数训练，其中，在不同的失真类型之间的权衡方面，所述不同的损失函数不同。

5.根据权利要求1所述的方法，其中，所述音频输入数据和所述经处理的音频数据是多声道音频数据。

6.根据权利要求1所述的方法...

【专利技术属性】
技术研发人员：佩曼·莫莱，拉斯穆斯·孔斯格德·奥尔森，卡里姆·哈达德，
申请(专利权)人：GN奥迪欧有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人