用于嘈杂的环境中的谈话隔离和安全性的使用深度神经网络动态频谱掩膜的参与者调谐过滤制造技术

技术编号：34121900 阅读：25 留言：0更新日期：2022-07-14 13:15

提供了隔离和放大所选择的参与者之间的谈话。接收多个频谱掩膜。所述多个频谱掩膜中的每个频谱掩膜对应于包括在谈话中的所选择的一组参与者中的相应参与者。复合频谱掩模是通过多个频谱掩模的加性叠加生成的。该复合频谱掩膜被应用于由麦克风捕捉的声音，以滤除与该复合频谱掩膜不匹配的声音并放大与该复合频谱掩膜匹配的剩余声音。频谱掩膜匹配的剩余声音。频谱掩膜匹配的剩余声音。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于嘈杂的环境中的谈话隔离和安全性的使用深度神经网络动态频谱掩膜的参与者调谐过滤

[0001]本公开一般涉及频谱掩膜，尤其涉及用于嘈杂的环境中的参与谈话隔离和安全性的使用深度神经网络动态频谱掩膜谈话的参与者调谐过滤。

技术介绍

[0002]在电信中，频谱掩膜是应用于声音的数学定义的过滤器。频谱掩膜一般旨在减少与频谱掩膜不匹配的声音。通常通过仅允许与频谱掩模匹配的那些声音通过来衰减这些不想要的声音。

技术实现思路

[0003]根据一个说明性实施例，提供一种用于隔离和放大所选参与者之间的谈话的方法。接收多个频谱掩膜。所述多个频谱掩膜中的每个频谱掩膜对应于包括在谈话中的所选择的一组参与者中的相应参与者。复合频谱掩模是通过多个频谱掩模的加性叠加生成的。该复合频谱掩膜被应用于由麦克风捕捉的声音，以滤除与该复合频谱掩膜不匹配的声音并放大与该复合频谱掩膜匹配的剩余声音。根据其他说明性实施例，提供一种用于隔离和放大所选参与者之间的谈话的移动设备和计算机程序产品。
[0004]不同的说明性实施例还将与复合频谱掩膜匹配的放大的剩余声音传输到对应于谈话的参与者的音频输出设备。进一步，音频输出设备邻近谈话的参与者的耳朵。
[0005]此外，不同的说明性实施例将谈话的参与者的语音样本发送到云环境的深度神经网络服务器，用于生成对参与者个性化的频谱掩膜，并从深度神经网络服务器接收对参与者个性化的频谱掩膜。不同的说明性实施例将对参与者个性化的频谱掩模与对应于所述谈话中包括的所选择的一组参与者的多频谱掩膜组合以形成所述...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于隔离和放大所选择的参与者之间的谈话的方法，所述方法包括：接收多个频谱掩膜，所述多个频谱掩膜中的每个频谱掩膜对应于包括在谈话中的所选择的一组参与者中的相应参与者；通过所述多个频谱掩模的加性叠加生成复合频谱掩模；以及将所述复合频谱掩膜应用于由麦克风所捕获的声音以滤除与所述复合频谱掩膜不匹配的声音并放大与所述复合频谱掩膜匹配的剩余声音。2.根据权利要求1所述的方法，进一步包括：将与所述复合频谱掩膜匹配的经放大的剩余声音传输到对应于所述谈话的参与者的音频输出设备。3.根据权利要求2所述的方法，进一步包括：执行所述谈话的实时字幕；以及在附接有所述音频输出设备的移动设备屏幕或智能眼镜之一上向所述谈话的参与者显示所述谈话的所述实时字幕，用于读取所述谈话的文本以及收听所述谈话。4.根据权利要求2所述的方法，其中所述音频输出设备邻近于所述谈话的所述参与者的耳朵。5.根据权利要求2所述的方法，进一步包括：将所述谈话的所述参与者的语音样本发送至云环境的深度神经网络服务器，用于生成对所述参与者个性化的频谱掩膜；以及从所述深度神经网络服务器接收对所述参与者个性化的所述频谱掩膜。6.根据权利要求5所述的方法，进一步包括：将对所述参与者个性化的所述频谱掩膜与对应于包括在所述谈话中的所选择的一组参与者的所述多个频谱掩膜进行组合以形成所述复合频谱掩膜；使用所述复合频谱掩膜过滤传入音频信号，以仅允许所选择的一组参与者和所述参与者之间的所述谈话保持在音频信号中；以及将仅包括所选择的一组参与者与所述参与者之间的所述谈话的所述音频信号传输到所述音频输出设备。7.根据权利要求6所述的方法，进一步包括：在对应于所述参与者和所选择的一组参与者的移动设备之间共享针对所述参与者个性化的所述频谱掩膜和对应于所选择的一组参与者的所述多个频谱掩膜，使得每个移动设备生成其自身的复合频谱掩膜以用于过滤到每个移动设备的传入音频信号。8.根据权利要求5所述的方法，其中基于所述参与者的偏好，将对所述谈话的参与者个性化的所述频谱掩膜从所述复合频谱掩膜中排除。9.根据权利要求1所述的方法，其中所选择的一组参与者指示谁被授权参与所述谈话。10.根据权利要求1所述的方法，其中所述方法由移动设备执行。11.根据权利要求10所述的方法，其中所述移动设备从对应于所述谈话中包括的所选择的一组参与者的移动设备无线地接收所述多个频谱掩膜。12.一种用于隔离和放大所选择的参与者之间的谈话的移动设备，所述移动设备包括：总线系统；存储设备，连接至所述总线系统，其中所述存储设备存储程序指令；以及
处理器，连接至所述总线系统，其中所述处理器执行所述程序指令以：接收多个频谱掩膜，所述多个频谱掩膜中的每个频谱掩膜对应于包括在谈话中的所选择的一组参与者中的相应参与者；通过所述多个频谱掩模的加性叠加生成复合频谱掩模；以及将所述复合频谱掩膜应用于由麦克风所捕获的声音以滤除与所述复合频谱掩膜不匹配的声音并放大与所述复合频谱掩膜匹配的剩余声音。13.根据权利要求12所述的移动设备，其中所述处理器进一步执行所述程序指令以：将与所述复合频谱掩膜匹配的经放大的剩余声音传输到对应于所述谈话的参与者的音频输出设备。14.根据权利要求13所述的移动设备，其中所述处理器进一步执行所述程序指令以：执行所述谈话的实时字幕；以及在附接有所述音频输出设备的移动设备屏幕或智能眼镜之一上向所述谈话的参与者显示所述谈话的所述实时字幕，用于读取所述谈话的文本以及收听...

【专利技术属性】
技术研发人员：J，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人