当前位置: 首页 > 专利查询>罗伯特专利>正文

声音处理装置、系统和方法制造方法及图纸

技术编号:30423981 阅读:18 留言:0更新日期:2021-10-24 16:53
本发明专利技术提供了声音处理装置、系统和方法。所述声音处理装置包括:接收模块,其被配置成接收所述个人声音设备所获取的一个或多个声音的音频信号;处理模块,其被配置成采用声音处理模型来执行:分类处理,在所述分类处理中,基于所述音频信号执行确定个人声音设备的使用者所处的场景类型;识别处理,在所述识别处理中,基于所确定的场景类型确定所述一个或多个声音中的各声音为期望声音或不期望声音;以及过滤处理,在所述过滤处理中,基于所述识别处理的结果执行过滤配置,并基于所述过滤平配置来过滤所述音频信号;以及输出模块,其被配置成输出经过滤的音频信号,以便提供给所述使用者。用者。用者。

【技术实现步骤摘要】
声音处理装置、系统和方法


[0001]本专利技术总体上涉及基于人工智能的声音处理,具体而言,本专利技术涉及一种用于个人声音设备的声音处理装置,还涉及包括该声音处理装置的系统,还涉及一种声音处理方法。

技术介绍

[0002]近年来,降噪耳机颇受欢迎,因为降噪耳机能够为佩戴者创造舒适的使用场景。例如,戴上耳机启动降噪按钮,就能够在安静的环境下享受自己喜欢的音乐;能够在办公或差旅场景中专注于自己的工作而不受环境噪音干扰。
[0003]现有技术中应用于耳机的降噪方案主要有被动降噪方案和主动降噪方案两大类别。被动降噪方案基于声音吸收和/或反射材料的被动降噪(PNR)技术来实现声音隔离。主动降噪方案使用基于抗噪声声音输出的主动降噪(ANR)技术来中和噪音,从而实现降噪的效果。
[0004]但是,无论是被动式降噪还是主动式降噪,会将一切噪音都过滤掉,这可能会导致危险。例如,虽然降噪耳机有效过滤掉了地铁上的嘈杂声音,但是有些想被听到的声音也被过滤了,比如报站声,婴儿哭声等。
[0005]因此,希望提出一种技术方案来解决现有技术中的上述问题。

技术实现思路

[0006]鉴于现有技术中的上述问题,本专利技术旨在提供一种用于个人声音设备的智能声音处理方案,其能够实现基于用户需求的自动化降噪。
[0007]为此,根据本专利技术的一个方面,提供了一种用于个人声音设备中的声音处理装置,包括:接收模块,其被配置成接收所述个人声音设备所获取的一个或多个声音的音频信号,所述一个或多个声音至少包括所述个人声音设备周围的环境声音;处理模块,其被配置成采用声音处理模型来执行:分类处理,在所述分类处理中,基于所述音频信号确定出个人声音设备的使用者所处的场景类型;识别处理,在所述识别处理中,基于所确定的场景类型识别出所述一个或多个声音中的各声音为期望声音或不期望声音;以及过滤处理,在所述过滤处理中,基于所述识别处理的结果执行过滤配置,并基于所述过滤平配置来过滤所述音频信号,从而使得所述一个或多个声音中的不期望声音被至少部分地过滤掉,并且使得所述一个或多个声音中的期望声音被通透;以及输出模块,其被配置成输出经过滤的音频信号,以便提供给所述使用者。
[0008]根据一种可行的实施方式,所述声音处理模型包括一个或多个基于机器学习的模型。
[0009]根据一种可行的实施方式,所述声音处理模型包括第一经训练的机器学习模型、第二经训练的机器学习模型和第三经训练的机器学习模型;并且所述处理模块被配置成:采用第一经训练的机器学习模型来对所述音频信号执行所述分类处理,以输出所述场景类
型;采用第二经训练的机器学习模型来基于第一经训练的机器学习模型的输出执行所述识别处理,以输出所述一个或多个声音中的各声音为期望声音或不期望声音;并且采用第三经训练的机器学习模型基于第二经训练的机器学习模型的输出执行所述过滤处理,以输出所述经过滤的音频信号。
[0010]根据一种可行的实施方式,所述第一、第二和第三经训练的机器学习模型被组合成一个或多个混合机器学习模型。
[0011]根据一种可行的实施方式,所述处理模块通过以下至少一项处理来确定各声音为期望声音或不期望声音:倒频谱分析、声纹识别、关键词和/或关键音检测。。
[0012]根据一种可行的实施方式,上述各项处理是所述处理模块分别采用与其相关的模型来执行的
[0013]根据一种可行的实施方式,所述声音处理装置还包括通信模块,其被配置成与位于个人声音设备外部的外部电子设备通信连接,以与设置于所述外部电子设备中的音频应用交互信息。
[0014]根据一种可行的实施方式,所述通信模块接收来自所述音频应用的指令,所述指令包含所述使用者对所确定的场景类型下的声音过滤的意向;并且所述处理模块根据所述指令来调整所述过滤配置。
[0015]根据一种可行的实施方式,所述通信模块被配置成:将所述个人声音设备在被使用过程中捕捉到的新声音的音频信号传输给所述音频应用;并且从所述音频应用接收基于所述新声音的音频信号的处理参数,以使得所述新声音能够被识别。
[0016]根据一种可行的实施方式,所述通信模块还被配置成从所述音频应用接收推荐音频内容,所述推荐音频内容基于所确定的场景类型和所述个人声音设备的使用状态。
[0017]根据一种可行的实施方式,所述声音处理装置的各模块中全部或部分借助于一个或多个AI芯片来实现。
[0018]根据本专利技术的另一个方面,提供了一种计算设备,其中,所述计算设备被设置于远程服务器中并且创建用于处理个人声音设备使用过程中获取的一个或多个声音的音频信号的声音处理模型,创建所述声音处理模型包括:执行第一创建过程,在该过程中,使得所述声音处理模型能够基于所述音频信号确定个人声音设备的使用者所处的场景类型;执行第二创建过程,在该过程中,使得所述声音处理模型能够基于所述场景类型确定所述一个或多个声音中的各声音为期望声音或不期望声音;执行第三创建过程,在该过程中,使得所述声音处理模型能够执行过滤配置以及对所述音频信号执行基于所述过程配置的过滤,从而使得所述一个或多个声音中的不期望声音被至少部分地过滤掉,并且使得所述一个或多个声音中的期望声音被通透。
[0019]根据一种可行的实施方式,创建所述声音处理模型包括在第一至第三创建过程中训练一个或多个基于机器学习的模型。
[0020]根据一种可行的实施方式,创建所述声音处理模型包括:对基于机器学习的模型执行第一训练以获得第一经训练的机器学习模型,在第一训练过程中,将所述音频信号作为输入,以生成表示所述场景类型的输出;对基于机器学习的模型执行第二训练以获得第二经训练的机器学习模型,在第二训练过程中,将第一经训练的机器学习模型的输出作为输入,以生成表示所述一个或多个声音中的各声音为期望声音或不期望声音的输出;并且
对基于机器学习的模型执行第三训练以获得第三经训练的机器学习模型,在第三训练过程中,将第二经训练的机器学习模型的输出作为输入,以输出所述经过滤的音频信号。
[0021]根据一种可行的实施方式,所述第一、第二和第三经训练的机器学习模型被组合成一个或多个混合机器学习模型。
[0022]根据一种可行的实施方式,所述计算设备还被配置成基于述个人声音设备在被使用过程中捕捉到的新声音的音频信号对所述声音处理模型执行再学习过程,以使得所述声音处理模型能够识别所述新声音为期望声音或不期望声音,并生成用于使得所述声音处理模型能够识别所述新声音的处理参数。
[0023]根据一种可行的实施方式,所述计算设备还被配置成对所述第二经训练的机器学习模型执行再训练,在所述再训练过程中,将所述个人声音设备在被使用过程中捕捉到的新声音的音频信号作为输入,以生成表示所述新声音为期望声音或不期望声音的输出;并且在所述再训练过程中,生成用于使得所述第二经训练的机器学习模型能够识别所述新声音的处理参数。
[0024]根据本专利技术的又一个方面,提供了一种声音处理系统,包括:设置于个人声音设备中的、如上所述的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于个人声音设备中的声音处理装置,包括:接收模块,其被配置成接收所述个人声音设备所获取的一个或多个声音的音频信号,所述一个或多个声音至少包括所述个人声音设备周围的环境声音;处理模块,其被配置成采用声音处理模型来执行:分类处理,在所述分类处理中,基于所述音频信号确定出个人声音设备的使用者所处的场景类型;识别处理,在所述识别处理中,基于所确定的场景类型识别出所述一个或多个声音中的各声音为期望声音或不期望声音;以及过滤处理,在所述过滤处理中,基于所述识别处理的结果执行过滤配置,并基于所述过滤平配置来过滤所述音频信号,从而使得所述一个或多个声音中的不期望声音被至少部分地过滤掉,并且使得所述一个或多个声音中的期望声音被通透;以及输出模块,其被配置成输出经过滤的音频信号,以便提供给所述使用者。2.如权利要求1所述的声音处理装置,其中,所述声音处理模型包括一个或多个基于机器学习的模型。3.如权利要求1或2所述的声音处理装置,其中,所述声音处理模型包括第一经训练的机器学习模型、第二经训练的机器学习模型和第三经训练的机器学习模型;并且所述处理模块被配置成:采用第一经训练的机器学习模型来对所述音频信号执行所述分类处理,以输出所述场景类型;采用第二经训练的机器学习模型来基于第一经训练的机器学习模型的输出执行所述识别处理,以输出所述一个或多个声音中的各声音为期望声音或不期望声音;并且采用第三经训练的机器学习模型基于第二经训练的机器学习模型的输出执行所述过滤处理,以输出所述经过滤的音频信号。4.如权利要求3所述的声音处理装置,其中,所述第一、第二和第三经训练的机器学习模型被组合成一个或多个混合机器学习模型。5.如权利要求1-4中任一项所述的声音处理装置,其中,所述处理模块通过以下至少一项处理来确定各声音为期望声音或不期望声音:倒频谱分析、声纹识别、关键词和/或关键音检测;可选地,各项处理是所述处理模块分别采用与其相关的模型来执行的。6.如权利要求1-5中任一项所述的声音处理装置,其中,所述声音处理装置还包括通信模块,其被配置成与位于个人声音设备外部的外部电子设备通信连接,以与设置于所述外部电子设备中的音频应用交互信息。7.如权利要求6所述的声音处理装置,其中,所述通信模块接收来自所述音频应用的指令,所述指令包含所述使用者对所确定的场景类型下的声音过滤的意向;并且所述处理模块根据所述指令来调整所述过滤配置。8.如权利要求6或7所述的声音处理装置,其中,所述通信模块被配置成:将所述个人声音设备在被使用过程中捕捉到的新声音的音频信号传输给所述音频应用;并且从所述音频应用接收基于所述新声音的音频信号的处理参数,以使得所述新声音能够
被识别。9.如权利要求6-8中任一项所述的声音处理装置,其中,所述通信模块还被配置成从所述音频应用接收推荐音频内容,所述推荐音频内容基于所确定的场景类型和所述个人声音设备的使用状态。10.如权利要求1-9中任一项所述的声音处理装置,其中,所述声音处理装置的各模块中全部或部分借助于一个或多个AI芯片来实现。11.一种计算设备,其中,所述计算设备被设置于远程服务器中并且创建用于处理个人声音设备使用过程中获取的一个或多个声音的音频信号的声音处理模型,创建所述声音处理模型包括:执行第一创建过程,在该过程中,使得所述声音处理模型能够基于所述音频信号确定个人声音设备的使用者所处的场景类型;执行第二创建过程,在该过程中,使得所述声音处理模型能够基于所述场景类型确定所述一个或多个声音中的各声音为期望声音或不期望声音;执行第三创建过程,在该过程中,使得所述声音处理模型能够执行过滤配置以及对所述音频信号执行基于所述过程配置的过滤,从而使得所述一个或多个声音中的不期望声音被至少部分地过滤掉,并且使得所述一个或多个声音中的...

【专利技术属性】
技术研发人员:谢晖王炜
申请(专利权)人:罗伯特
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1