用于多麦克风信号处理的数据增强的系统和方法技术方案

技术编号:36332818 阅读:17 留言:0更新日期:2023-01-14 17:43
一种方法、计算机程序产品和计算系统,用于接收来自多个麦克风中的每个麦克风的信号,从而定义多个信号。可以对多个信号执行一个或多个基于麦克风间增益的增强,从而定义一个或多个麦克风间增益增强的信号。对多个信号执行一个或多个基于麦克风间增益的增强可以包括将来自多个增益级别的增益级别应用于来自每个麦克风的信号。将来自多个增益级别的增益级别应用于来自每个麦克风的信号可以包括将来自预定义的增益级别范围的增益级别应用于来自每个麦克风的信号。将来自多个增益级别的增益级别应用于来自每个麦克风的信号可以包括将来自预定义的增益级别范围的随机增益级别应用于来自每个麦克风的信号。应用于来自每个麦克风的信号。应用于来自每个麦克风的信号。

【技术实现步骤摘要】
【国外来华专利技术】用于多麦克风信号处理的数据增强的系统和方法
[0001]相关申请
[0002]本申请要求于2020年5月8日提交的以下美国临时申请第63/022,269号的权利,其全部内容通过引用并入本文。

技术介绍

[0003]自动临床文档化(ACD)可用于例如将转录的对话(例如,医生、患者和/或其他参与者,例如患者的家庭成员、护士、医生助理等)语音转换为格式化(例如,医疗)报告。这样的报告可以被检查,例如以确保医生、抄写员等报告的准确性。
[0004]为了提高ACD的语音处理的准确性,数据增强可以允许通过增强现有数据以表示新的条件,来生成用于机器学习系统的新训练数据。例如,数据增强已被用于提高对真实世界部署中的语音的噪声和混响以及其他不可预测特征的鲁棒性(例如,与受控环境相比,当在真实世界环境中捕获语音信号时的问题和不可预测特性)。
[0005]音频记录系统的各种物理特性可能导致语音处理性能的降低。例如,微电子机械系统(MEMS)麦克风通常可以包括机械设备,其感测声学空气压力并且在大多数流行的消费设备(例如,移动电话、视频会议系统和多麦克风阵列系统)中形成用于声学信号采集的主传感器。
[0006]MEMS麦克风可能存在各种缺陷。例如,这些MEMS麦克风的已知缺陷通常包括麦克风灵敏度缺陷、麦克风自噪声、麦克风频率响应和谐波失真。
[0007]当设计多麦克风系统或阵列时,通常假设系统或阵列中的所有麦克风完全匹配良好。然而,这在现实世界系统中通常并不准确。因此,虽然传统方法试图估计这些缺陷并对其进行补偿(例如,通常仅考虑麦克风灵敏度),或者通过依赖昂贵的校准过程来建立缺陷并补偿这些缺陷(这在大规模上是不可行的),但底层增强算法依赖于完全匹配的麦克风。

技术实现思路

[0008]在一个实现中,由计算机执行的计算机实现的方法可以包括但不限于接收来自多个麦克风中的每个麦克风的信号,从而定义多个信号。可以对多个信号执行一个或多个基于麦克风间增益的增强,从而定义一个或多个麦克风间增益增强的信号。
[0009]可以包括以下一个或多个特征。对多个信号执行一个或多个基于麦克风间增益的增强可以包括将来自多个增益级别的增益级别应用于来自每个麦克风的信号。将来自多个增益级别的增益级别应用于来自每个麦克风的信号可以包括将来自预定义的增益级别范围的增益级别应用于来自每个麦克风的信号。将来自多个增益级别的增益级别应用于来自每个麦克风的信号可以包括将来自预定义的增益级别范围的随机增益级别应用于来自每个麦克风的信号。对一个或多个信号执行一个或多个基于麦克风间增益的增强可以包括将一个或多个信号转换到频域。对一个或多个信号执行一个或多个基于麦克风间增益的增强可以包括将多个增益级别应用于被转换到频域的一个或多个信号的多个频带。对一个或多个信号执行一个或多个基于麦克风间增益的增强可以包括以下一项或多项:放大一个或多
个信号的至少一部分;以及衰减一个或多个信号的至少一部分。
[0010]在另一实现中,一种计算机程序产品驻留在计算机可读介质上并且具有存储在其上的多个指令。指令当由处理器执行时,使处理器执行操作,包括但不限于接收来自多个麦克风中的每个麦克风的信号,从而定义多个信号。可以对多个信号执行一个或多个基于麦克风间增益的增强,从而定义一个或多个麦克风间增益增强的信号。
[0011]可以包括以下一个或多个特征。对多个信号执行一个或多个基于麦克风间增益的增强可以包括将来自多个增益级别的增益级别应用于来自每个麦克风的信号。将来自多个增益级别的增益级别应用于来自每个麦克风的信号可以包括将来自预定义的增益级别范围的增益级别应用于来自每个麦克风的信号。将来自多个增益级别的增益级别应用于来自每个麦克风的信号可以包括将来自预定义的增益级别范围的随机增益级别应用于来自每个麦克风的信号。对一个或多个信号执行一个或多个基于麦克风间增益的增强可以包括将一个或多个信号转换到频域。对一个或多个信号执行一个或多个基于麦克风间增益的增强可以包括将多个增益级别应用于被转换到频域的一个或多个信号的多个频带。对一个或多个信号执行一个或多个基于麦克风间增益的增强可以包括以下一项或多项:放大一个或多个信号的至少一部分;以及衰减一个或多个信号的至少一部分。
[0012]在另一实现中,一种计算系统包括处理器,以及存储器,其被配置为执行操作,包括但不限于接收来自多个麦克风中的每个麦克风的信号,从而定义多个信号。处理器还可以被配置为对多个信号执行一个或多个基于麦克风间增益的增强,从而定义一个或多个麦克风间增益增强的信号。
[0013]可以包括以下一个或多个特征。对多个信号执行一个或多个基于麦克风间增益的增强可以包括将来自多个增益级别的增益级别应用于来自每个麦克风的信号。将来自多个增益级别的增益级别应用于来自每个麦克风的信号可以包括将来自预定义的增益级别范围的增益级别应用于来自每个麦克风的信号。将来自多个增益级别的增益级别应用于来自每个麦克风的信号可以包括将来自预定义的增益级别范围的随机增益级别应用于来自每个麦克风的信号。对一个或多个信号执行一个或多个基于麦克风间增益的增强可以包括将一个或多个信号转换到频域。对一个或多个信号执行一个或多个基于麦克风间增益的增强可以包括将多个增益级别应用于被转换到频域的一个或多个信号的多个频带。对一个或多个信号执行一个或多个基于麦克风间增益的增强可以包括以下一项或多项:放大一个或多个信号的至少一部分;以及衰减一个或多个信号的至少一部分。
[0014]一个或多个实现的细节在附图和下面的描述中阐述。其他特征和优点将从说明书、附图和权利要求书中显而易见。
附图说明
[0015]图1是耦合到分布式计算网络的自动临床文档化计算机系统和数据增强过程的示意图;
[0016]图2是并入图1的自动临床文档化计算机系统的模块化ACD系统的示意图;
[0017]图3是被包括在图2的模块化ACD系统内的混合媒体ACD设备的示意图;
[0018]图4是图1的数据增强过程的一个实现的流程图;
[0019]图5至图6是根据图1的数据增强过程的各种实现的模块化ACD系统的示意图;
[0020]图7是图1的数据增强过程的一个实现的流程图;
[0021]图8是根据图1的数据增强过程的一个实现的模块化ACD系统的示意图;
[0022]图9是图1的数据增强过程的一个实现的流程图;
[0023]图10是根据图1的数据增强过程的一个实现的模块化ACD系统的示意图;
[0024]图11是根据图1的数据增强过程的一个实现的麦克风频率响应的示意图;
[0025]图12是图1的数据增强过程的一个实现的流程图;以及
[0026]图13是根据图1的数据增强过程的一个实现的模块化ACD系统的示意图。
[0027]各种附图中相同的附图标记表示相同的元件。
具体实施方式
[0028]系统概述:
[0029]参考图1,示出了数据增强过程10。如下面将更详细地讨论本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种在计算设备上执行的计算机实现的方法,包括:接收来自多个麦克风中的每个麦克风的信号,从而定义多个信号;以及对所述多个信号执行一个或多个基于麦克风间增益的增强,从而定义一个或多个麦克风间增益增强的信号。2.根据权利要求1所述的计算机实现的方法,其中对所述多个信号执行所述一个或多个基于麦克风间增益的增强包括:将来自多个增益级别的增益级别应用于来自每个麦克风的所述信号。3.根据权利要求2所述的计算机实现的方法,其中将来自所述多个增益级别的所述增益级别应用于来自每个麦克风的所述信号包括:将来自预定义的增益级别范围的增益级别应用于来自每个麦克风的所述信号。4.根据权利要求3所述的计算机实现的方法,其中将来自所述多个增益级别的所述增益级别应用于来自每个麦克风的所述信号包括:将来自所述预定义的增益级别范围的随机增益级别应用于来自每个麦克风的所述信号。5.根据权利要求1所述的计算机实现的方法,其中对所述一个或多个信号执行所述一个或多个基于麦克风间增益的增强包括:将所述一个或多个信号转换到频域。6.根据权利要求5所述的计算机实现的方法,其中对所述一个或多个信号执行所述一个或多个基于麦克风间增益的增强包括:将多个增益级别应用于被转换到所述频域的所述一个或多个信号的多个频带。7.根据权利要求1所述的计算机实现的方法,其中对所述一个或多个信号执行所述一个或多个基于麦克风间增益的增强包括以下中的一项或多项:放大所述一个或多个信号的至少一部分;以及衰减所述一个或多个信号的至少一部分。8.一种计算机程序产品,所述计算机程序产品驻留在非瞬态计算机可读介质上,所述非瞬态计算机可读介质上存储有多个指令,所述指令在由处理器执行时,使所述处理器执行操作,所述操作包括:接收来自多个麦克风中的每个麦克风的信号,从而定义多个信号;以及对所述多个信号执行一个或多个基于麦克风间增益的增强,从而定义一个或多个麦克风间增益增强的信号。9.根据权利要求8所述的计算机程序产品,其中对所述多个信号执行所述一个或多个基于麦克风间增益的增强包括:将多个增益级别应用于来自每个麦克风的所述信号。10.根据权利要求9所述的计算机程序产品,其中将所述多个增益级别应用于每个麦克风的所述信...

【专利技术属性】
技术研发人员:D
申请(专利权)人:纽奥斯通讯有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1