声音处理装置、系统和方法制造方法及图纸

技术编号：30423981 阅读：35 留言：0更新日期：2021-10-24 16:53

本发明专利技术提供了声音处理装置、系统和方法。所述声音处理装置包括：接收模块，其被配置成接收所述个人声音设备所获取的一个或多个声音的音频信号；处理模块，其被配置成采用声音处理模型来执行：分类处理，在所述分类处理中，基于所述音频信号执行确定个人声音设备的使用者所处的场景类型；识别处理，在所述识别处理中，基于所确定的场景类型确定所述一个或多个声音中的各声音为期望声音或不期望声音；以及过滤处理，在所述过滤处理中，基于所述识别处理的结果执行过滤配置，并基于所述过滤平配置来过滤所述音频信号；以及输出模块，其被配置成输出经过滤的音频信号，以便提供给所述使用者。用者。用者。

全部详细技术资料下载

【技术实现步骤摘要】
声音处理装置、系统和方法

[0001]本专利技术总体上涉及基于人工智能的声音处理，具体而言，本专利技术涉及一种用于个人声音设备的声音处理装置，还涉及包括该声音处理装置的系统，还涉及一种声音处理方法。

技术介绍

[0002]近年来，降噪耳机颇受欢迎，因为降噪耳机能够为佩戴者创造舒适的使用场景。例如，戴上耳机启动降噪按钮，就能够在安静的环境下享受自己喜欢的音乐；能够在办公或差旅场景中专注于自己的工作而不受环境噪音干扰。
[0003]现有技术中应用于耳机的降噪方案主要有被动降噪方案和主动降噪方案两大类别。被动降噪方案基于声音吸收和/或反射材料的被动降噪(PNR)技术来实现声音隔离。主动降噪方案使用基于抗噪声声音输出的主动降噪(ANR)技术来中和噪音，从而实现降噪的效果。
[0004]但是，无论是被动式降噪还是主动式降噪，会将一切噪音都过滤掉，这可能会导致危险。例如，虽然降噪耳机有效过滤掉了地铁上的嘈杂声音，但是有些想被听到的声音也被过滤了，比如报站声，婴儿哭声等。
[0005]因此，希望提出一种技术方案来解...

【技术保护点】

【技术特征摘要】
1.一种用于个人声音设备中的声音处理装置，包括：接收模块，其被配置成接收所述个人声音设备所获取的一个或多个声音的音频信号，所述一个或多个声音至少包括所述个人声音设备周围的环境声音；处理模块，其被配置成采用声音处理模型来执行：分类处理，在所述分类处理中，基于所述音频信号确定出个人声音设备的使用者所处的场景类型；识别处理，在所述识别处理中，基于所确定的场景类型识别出所述一个或多个声音中的各声音为期望声音或不期望声音；以及过滤处理，在所述过滤处理中，基于所述识别处理的结果执行过滤配置，并基于所述过滤平配置来过滤所述音频信号，从而使得所述一个或多个声音中的不期望声音被至少部分地过滤掉，并且使得所述一个或多个声音中的期望声音被通透；以及输出模块，其被配置成输出经过滤的音频信号，以便提供给所述使用者。2.如权利要求1所述的声音处理装置，其中，所述声音处理模型包括一个或多个基于机器学习的模型。3.如权利要求1或2所述的声音处理装置，其中，所述声音处理模型包括第一经训练的机器学习模型、第二经训练的机器学习模型和第三经训练的机器学习模型；并且所述处理模块被配置成：采用第一经训练的机器学习模型来对所述音频信号执行所述分类处理，以输出所述场景类型；采用第二经训练的机器学习模型来基于第一经训练的机器学习模型的输出执行所述识别处理，以输出所述一个或多个声音中的各声音为期望声音或不期望声音；并且采用第三经训练的机器学习模型基于第二经训练的机器学习模型的输出执行所述过滤处理，以输出所述经过滤的音频信号。4.如权利要求3所述的声音处理装置，其中，所述第一、第二和第三经训练的机器学习模型被组合成一个或多个混合机器学习模型。5.如权利要求1-4中任一项所述的声音处理装置，其中，所述处理模块通过以下至少一项处理来确定各声音为期望声音或不期望声音：倒频谱分析、声纹识别、关键词和/或关键音检测；可选地，各项处理是所述处理模块分别采用与其相关的模型来执行的。6.如权利要求1-5中任一项所述的声音处理装置，其中，所述声音处理装置还包括通信模块，其被配置成与位于个人声音设备外部的外部电子设备通信连接，以与设置于所述外部电子设备中的音频应用交互信息。7.如权利要求6所述的声音处理装置，其中，所述通信模块接收来自所述音频应用的指令，所述指令包含所述使用者对所确定的场景类型下的声音过滤的意向；并且所述处理模块根据所述指令来调整所述过滤配置。8.如权利要求6或7所述的声音处理装置，其中，所述通信模块被配置成：将所述个人声音设备在被使用过程中捕捉到的新声音的音频信号传输给所述音频应用；并且从所述音频应用接收基于所述新声音的音频信号的处理参数，以使得所述新声音能够
被识别。9.如权利要求6-8中任一项所述的声音处理装置，其中，所述通信模块还被配置成从所述音频应用接收推荐音频内容，所述推荐音频内容基于所确定的场景类型和所述个人声音设备的使用状态。10.如权利要求1-9中任一项所述的声音处理装置，其中，所述声音处理装置的各模块中全部或部分借助于一个或多个AI芯片来实现。11.一种计算设备，其中，所述计算设备被设置于远程服务器中并且创建用于处理个人声音设备使用过程中获取的一个或多个声音的音频信号的声音处理模型，创建所述声音处理模型包括：执行第一创建过程，在该过程中，使得所述声音处理模型能够基于所述音频信号确定个人声音设备的使用者所处的场景类型；执行第二创建过程，在该过程中，使得所述声音处理模型能够基于所述场景类型确定所述一个或多个声音中的各声音为期望声音或不期望声音；执行第三创建过程，在该过程中，使得所述声音处理模型能够执行过滤配置以及对所述音频信号执行基于所述过程配置的过滤，从而使得所述一个或多个声音中的不期望声音被至少部分地过滤掉，并且使得所述一个或多个声音中的...

【专利技术属性】
技术研发人员：谢晖，王炜，
申请(专利权)人：罗伯特，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人