一次性声学回声生成网络制造技术

技术编号：37038446 阅读：17 留言：0更新日期：2023-03-29 19:17

包括在计算机存储介质上编码的用于生成回波记录的计算机程序、方法、系统和装置。该系统接收由自动编码器中，表示音频信号和一个目标回波嵌入包含约一个目标房间信息的音频信号表示。自动编码器包括编码器和解码器。该系统发电机密封，由编码器中内容中嵌入和估计的回声嵌入。该系统发电机密封，由解码器基于所述内容嵌入和目标的回波记录表示回声嵌入。述内容嵌入和目标的回波记录表示回声嵌入。述内容嵌入和目标的回波记录表示回声嵌入。

全部详细技术资料下载

【技术实现步骤摘要】
一次性声学回声生成网络

[0001]本专利技术总体上涉及机器学习，更具体地，涉及用于生成模拟真实世界数据的音频记录的系统和方法。

技术介绍

[0002]声学回声消除(AEC)是一个重要组成部分音频记录以减少或消除回声和显着改善声音质量为一个用户。回声消除现在变得更加重要，因为移动计算和视频通信已经导致数字语音消费的爆炸式增长。该技术可应用于许多视频会议、音频通话、视频录制、播客等领域。然而，用户在室内或室外等多种应用环境中录制音频，并使用多种录音设备，这对声学回声消除提出了挑战。神经网络是一种很有前途的声学回声消除技术，但该技术可能需要大量的训练数据(例如录音)来训练神经网络以获得足够的性能。
[0003]当前收集用于训练AEC神经网络的大型录音数据集的方法既昂贵又费力。传统方法需要手动收集来自许多不同环境的录音，以提供代表每个环境中回声的训练示例，这些示例可用于应用程序的实际使用中。尤其地，研究者可设立多个模拟房间以及不同的记录设备和再现设备(用于播放音频样本)，以模拟不同的环境。在每个房间收集数据并测量每个房间的特征的过程可能是劳动密集型的。此外，他达到的训练数据基础上的房间，研究人员能够建立和使用记录的数量是有限的。这种方法是劳动密集型和昂贵的，并且限制了训练数据中可以表示的不同环境的数量。有时，可以使用基于数字信号处理(DSP)的回波生成来辅助数据生成，但这种方法仍然需要收集有关房间或其他复杂测量任务的信息。因此，由于基于有限数量的训练数据的不正确泛化，AEC神经网络可能表现不佳。
[0004...

【技术保护点】

【技术特征摘要】
1.一种回声记录生成系统，包括一个或多个处理器，配置为执行以下操作：由自动编码器接收表示音频信号的音频信号表示和包括关于目标房间的信息的目标回声嵌入，其中自动编码器包括编码器和解码器；由编码器生成内容嵌入和估计的回声嵌入；由解码器基于内容嵌入和目标回声嵌入生成回声记录表示；和其中，回声记录表示表示包括来自在目标房间中播放的估计回声的音频信号。2.根据权利要求1所述的系统，其中：所述目标回波嵌入对关于目标房间的几何形状和一个或多个回波路径的信息进行编码。3.根据权利要求1所述的系统，其中：当目标回声嵌入与估计的回声嵌入相同时，则音频信号表示与回声记录表示相同。4.根据权利要求1所述的系统，其中：通过将表示在目标房间中记录的第二音频信号的第二音频信号表示输入到自动编码器中来生成目标回声嵌入。5.根据权利要求1所述的系统，其中：所述音频信...

【专利技术属性】
技术研发人员：Z，
申请(专利权)人：祖玛视频通讯公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人