用于多麦克风信号处理的数据增强的系统和方法技术方案

技术编号:36332817 阅读:22 留言:0更新日期:2023-01-14 17:43
一种方法、计算机程序产品和计算系统,用于接收来自多个麦克风中的每个麦克风的信号,从而定义多个信号。可以接收与至少一个麦克风相关联的一个或多个麦克风频率响应。可以至少部分地基于一个或多个麦克风频率响应对多个信号执行一个或多个基于麦克风频率响应的增强,从而定义一个或多个基于麦克风频率响应的增强信号。增强信号。增强信号。

【技术实现步骤摘要】
【国外来华专利技术】用于多麦克风信号处理的数据增强的系统和方法
[0001]相关申请
[0002]本申请要求于2020年5月8日提交的以下美国临时申请第63/022,269号的权利,其全部内容通过引用并入本文。

技术介绍

[0003]自动临床文档化(ACD)可用于例如将转录的对话(例如,医生、患者和/或其他参与者,例如患者的家庭成员、护士、医生助理等)语音转换为格式化(例如,医疗)报告。这样的报告可以被检查,例如以确保医生、抄写员等报告的准确性。
[0004]为了提高ACD的语音处理的准确性,数据增强可以允许通过增强现有数据以表示新的条件,来生成用于机器学习系统的新训练数据。例如,数据增强已被用于提高对真实世界部署中的语音的噪声和混响以及其他不可预测特征的鲁棒性(例如,与受控环境相比,当在真实世界环境中捕获语音信号时的问题和不可预测特性)。
[0005]音频记录系统的各种物理特性可能导致语音处理性能的降低。例如,微电子机械系统(MEMS)麦克风通常可以包括机械设备,其感测声学空气压力并且在大多数流行的消费设备(例如,移动电话、视频会议系统和多麦克风阵列系统)中形成用于声学信号采集的主传感器。
[0006]MEMS麦克风可能存在各种缺陷。例如,这些MEMS麦克风的已知缺陷通常包括麦克风灵敏度缺陷、麦克风自噪声、麦克风频率响应和谐波失真。
[0007]当设计多麦克风系统或阵列时,通常假设系统或阵列中的所有麦克风完全匹配良好。然而,这在现实世界系统中通常并不准确。因此,虽然传统方法试图估计这些缺陷并对其进行补偿(例如,通常仅考虑麦克风灵敏度),或者通过依赖昂贵的校准过程来建立缺陷并补偿这些缺陷(这在大规模上是不可行的),但底层增强算法依赖于完全匹配的麦克风。

技术实现思路

[0008]在一个实现中,由计算机执行的计算机实现的方法可以包括但不限于接收来自多个麦克风中的每个麦克风的信号,从而定义多个信号。可以接收与至少一个麦克风相关联的一个或多个麦克风频率响应。可以至少部分地基于一个或多个麦克风频率响应对多个信号执行一个或多个基于麦克风频率响应的增强,从而定义一个或多个基于麦克风频率响应的增强信号。
[0009]可以包括一个或多个以下特征。接收与至少一个麦克风相关联的一个或多个频率响应可以包括:模拟表示麦克风频率响应的一个或多个模型。接收与至少一个麦克风相关联的一个或多个频率响应可以包括:测量来自至少一个麦克风的频率响应。至少部分地基于一个或多个麦克风频率响应对多个信号执行一个或多个基于麦克风频率响应的增强可以包括:至少部分地基于一个或多个麦克风频率响应增强来多个信号的幅度分量和相位分量中的一个或多个。至少部分地基于一个或多个麦克风频率响应对多个信号执行一个或多个基于麦克风频率响应的增强可以包括:利用一个或多个麦克风频率响应对多个信号进行
滤波。至少部分地基于一个或多个麦克风频率响应对多个信号执行一个或多个基于麦克风频率响应的增强可以包括:利用从一个或多个麦克风频率响应随机选择的麦克风频率响应对多个信号进行滤波。多个麦克风可以定义麦克风阵列。
[0010]在另一实现中,计算机程序产品驻留在计算机可读介质上,并具有存储在其上的多个指令。当由处理器执行时,指令使处理器执行操作包括但不限于接收来自多个麦克风中的每个麦克风的信号,从而定义多个信号。可以接收与至少一个麦克风相关联的一个或多个麦克风频率响应。可以至少部分地基于一个或多个麦克风频率响应对多个信号执行一个或多个基于麦克风频率响应的增强,从而定义一个或多个基于麦克风频率响应的增强信号。
[0011]可以包括一个或多个以下特征。接收与至少一个麦克风相关联的一个或多个频率响应可以包括:模拟表示麦克风频率响应的一个或多个模型。接收与至少一个麦克风相关联的一个或多个频率响应可以包括:测量来自至少一个麦克风的频率响应。至少部分地基于一个或多个麦克风频率响应对多个信号执行一个或多个基于麦克风频率响应的增强可以包括:至少部分地基于一个或多个麦克风频率响应来增强多个信号的幅度分量和相位分量中的一个或多个。至少部分地基于一个或多个麦克风频率响应对多个信号执行一个或多个基于麦克风频率响应的增强可以包括:利用一个或多个麦克风频率响应对多个信号进行滤波。至少部分地基于一个或多个麦克风频率响应对多个信号执行一个或多个基于麦克风频率响应的增强可以包括:利用从一个或多个麦克风频率响应中随机选择的麦克风频率响应对多个信号进行滤波。多个麦克风可以定义麦克风阵列。
[0012]在另一实现中,计算系统包括处理器,并且存储器被配置为执行包括但不限于接收来自多个麦克风中的每个麦克风的语音信号,从而定义多个信号的操作。处理器还可以被配置为接收与至少一个麦克风相关联的一个或多个麦克风频率响应。处理器还可以被配置为至少部分基于一个或多个麦克风频率响应对多个信号执行一个或多个基于麦克风频率响应的增强,从而定义一个或多个基于麦克风频率响应的增强信号。
[0013]可以包括一个或多个以下特征。接收与至少一个麦克风相关联的一个或多个频率响应可以包括:模拟表示麦克风频率响应的一个或多个模型。接收与至少一个麦克风相关联的一个或多个频率响应可以包括:测量来自至少一个麦克风的频率响应。至少部分地基于一个或多个麦克风频率响应对多个信号执行一个或多个基于麦克风频率响应的增强可以包括:至少部分地基于一个或多个麦克风频率响应来增强多个信号的幅度分量和相位分量中的一个或多个。至少部分地基于一个或多个麦克风频率响应对多个信号执行一个或多个基于麦克风频率响应的增强:可以包括利用一个或多个麦克风频率响应对多个信号进行滤波。至少部分地基于一个或多个麦克风频率响应对多个信号执行一个或多个基于麦克风频率响应的增强可以包括:利用从一个或多个麦克风频率响应中随机选择的麦克风频率响应对多个信号进行滤波。多个麦克风可以定义麦克风阵列。
[0014]一个或多个实现的细节在附图和下面的描述中阐述。其他特征和优点将从说明书、附图和权利要求书中显而易见。
附图说明
[0015]图1是耦合到分布式计算网络的自动临床文档化计算机系统和数据增强过程的示
意图;
[0016]图2是并入图1的自动临床文档化计算机系统的模块化ACD系统的示意图;
[0017]图3是被包括在图2的模块化ACD系统内的混合媒体ACD设备的示意图;
[0018]图4是图1的数据增强过程的一个实现的流程图;
[0019]图5至图6是根据图1的数据增强过程的各种实现的模块化ACD系统的示意图;
[0020]图7是图1的数据增强过程的一个实现的流程图;
[0021]图8是根据图1的数据增强过程的一个实现的模块化ACD系统的示意图;
[0022]图9是图1的数据增强过程的一个实现的流程图;
[0023]图10是根据图1的数据增强过程的一个实现的模块化ACD系统的示意图;
[0024]图11是根据图1的数据增强过程的一个实现的麦克风频率响应的示意图;
[0025]图12是图1的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种在计算设备上执行的计算机实现的方法,包括:接收来自多个麦克风中的每个麦克风的信号,从而定义多个信号;接收与至少一个麦克风相关联的一个或多个麦克风频率响应;以及至少部分地基于所述一个或多个麦克风频率响应对所述多个信号执行一个或多个基于麦克风频率响应的增强,从而定义一个或多个基于麦克风频率响应的增强信号。2.根据权利要求1所述的计算机实现的方法,其中接收与所述至少一个麦克风相关联的所述一个或多个频率响应包括:模拟表示麦克风频率响应的一个或多个模型。3.根据权利要求1所述的计算机实现的方法,其中接收与所述至少一个麦克风相关联的所述一个或多个频率响应包括:测量来自所述至少一个麦克风的频率响应。4.根据权利要求1所述的计算机实现的方法,其中至少部分地基于所述一个或多个麦克风频率响应对所述多个信号执行所述一个或多个基于麦克风频率响应的增强包括:至少部分地基于所述一个或多个麦克风频率响应来增强所述多个信号的幅度分量和相位分量中的一个或多个。5.根据权利要求1所述的计算机实现的方法,其中至少部分地基于所述一个或多个麦克风频率响应对所述多个信号执行所述一个或多个基于麦克风频率响应的增强包括:利用所述一个或多个麦克风频率响应对所述多个信号进行滤波。6.根据权利要求1所述的计算机实现的方法,其中至少部分地基于所述一个或多个麦克风频率响应对所述多个信号执行所述一个或多个基于麦克风频率响应的增强包括:利用从所述一个或多个麦克风频率响应随机选择的麦克风频率响应对所述多个信号进行滤波。7.根据权利要求1所述的计算机实现的方法,其中所述多个麦克风定义麦克风阵列。8.一种计算机程序产品,所述计算机程序产品驻留在非瞬态计算机可读介质上,所述非瞬态计算机可读介质上存储有多个指令,所述指令在由处理器执行时,使所述处理器执行操作,所述操作包括:接收来自多个麦克风中的每个麦克风的语音信号,从而定义多个信号;接收与至少一个麦克风相关联的一个或多个麦克风频率响应;以及至少部分地基于所述一个或多个麦克风频率响应对所述多个信号执行一个或多个基于麦克风频率响应的增强,从而定义一个或多个基于麦克风频率响应的增强信号。9.根据权利要求8所述的计算机程序产品,其中接收与所述至少一个麦克风相关联的所述一个或多个频率响应包括:模拟表示麦克风频率响应的一个或多个模型。10.根据权利要求8所述的计算机程序产品,其中接收与所述至少一个麦克风相关联的所述一个或多个频率响应包括:测量来自所述至少一个麦克风的频率响应。11.根据权利...

【专利技术属性】
技术研发人员:D
申请(专利权)人:纽奥斯通讯有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1