用于处理音频信号的信号处理装置、系统和方法制造方法及图纸

技术编号:30776280 阅读:13 留言:0更新日期:2021-11-16 07:35
本发明专利技术描述了一种用于处理音频信号的信号处理装置(4)。信号处理装置(4)具有用于接收输入信号的输入接口(13)以及用于输出输出信号的输出接口(14)。此外,信号处理装置(4)具有用于调节输入信号的至少一个第一神经网络(10)以及用于从输入信号中分离一个或多个音频信号的至少一个第二神经网络(11)。至少一个第一神经网络(10)和至少一个第二神经网络(11)按顺序排列。(11)按顺序排列。(11)按顺序排列。

【技术实现步骤摘要】
【国外来华专利技术】用于处理音频信号的信号处理装置、系统和方法
[0001]本申请要求德国专利申请DE102019200954.9的优先权,其内容通过引用并入本文。


[0002]本创新技术涉及一种用于处理音频信号的信号处理装置。此外,本创新技术涉及一种具有这种信号处理装置的系统,尤其是听力装置系统。此外,本创新技术包括一种用于处理音频信号的方法。

技术介绍

[0003]用于处理音频信号的信号处理设备以及方法在现有技术中是已知的。例如将它们用于听力装置中。

技术实现思路

[0004]本创新技术的一个目的是提供一种信号处理装置,借助该信号处理装置来改善音频信号的处理。尤其是,目的是提供一种允许将输入信号高效地分离成单个或多个音频信号的信号处理装置。本创新技术的一个特定目的是促进语音增强,尤其是,即使输入的音频信号嘈杂和/或具有许多分量,也提供听力方面清晰的语音。
[0005]这些目的通过具有权利要求1中规定的特征的信号处理装置来实现。信号处理装置具有用于接收输入信号的输入接口和用于输出输出信号的输出接口。此外,信号处理装置具有用于调节输入信号的至少一个第一神经网络和用于从输入信号中分离一个或多个音频信号的至少一个第二神经网络。此处和下文中,术语“神经网络”要理解为表示人工神经网络。
[0006]此处和下文中,术语“信号处理”通常是指修改和/或合成信号。信号处理的子集是“声音增强”,它可以包括“语音增强”。声音增强通常是指改善听者听到特定声音的清晰度或能力。例如,语音增强是指改善信号中的语音质量,以便听者可以更好地理解语音。
[0007]本创新技术的实质是将至少一个第一神经网络和至少一个第二神经网络按顺序布置。至少一个第一神经网络和至少一个第二神经网络的顺序布置意味着这些网络串联连接以处理输入信号。尤其是,来自至少一个第一神经网络的输出用作至少一个第二神经网络的输入。神经网络的顺序布置允许功能地划分成不同的处理步骤。这样,独立于通过使用至少一个第二神经网络从输入信号中分离一个或多个音频信号,通过使用至少一个第一神经网络对输入信号进行调节。这允许音频信号的高效处理,尤其是音频信号的高效且准确分离。音频信号的分离尤其可以实时进行,也就是说没有显著的延迟。这样,例如可以借助至少一个第一神经网络对输入信号进行调节,使得可以通过至少一个第二神经网络特别容易且高效地处理被调节的输入信号。这也增加了分离的准确度。
[0008]根据本创新技术所述的信号处理装置的另一个优点是其改善的灵活性。这样,不同的第一神经网络可以与不同的第二神经网络组合以确保对针对各个输入信号而被定制
的音频信号的处理。已经发现,独立于输入信号而规定至少一个第一神经网络是特别高效的,这是因为调节输入信号所需的步骤可以普遍应用于所有不同类型的输入信号。然后,可以特别优选地针对要将从输入信号中分离的各个音频信号来定制至少一个第二神经网络。
[0009]输入信号可以例如通过使用一个或多个记录装置被记录并且随后可以被传输到信号处理装置的输入接口。例如,对于每个记录装置,输入信号具有一个或多个通道。以这种方式,尤其可以记录立体声信号。
[0010]输入信号通常包括未知数量的不同音频信号。不同音频信号尤其可以来自不同的声源,例如对话者、经过的汽车、背景音乐等。优选地,以源特定的方式将一个或多个音频信号从输入信号中分离。在这种情况下,特定声源(例如对话者)的音频信号从输入信号中分离。特别优选地,多个音频信号从输入信号中分离。以此方式,不同声源的音频信号可以彼此独立地被处理。这允许对单个音频信号进行选择性处理和加权。例如,对话者的音频信号可以被放大,而附近人的谈话被拒收。音频信号的处理可以以源特定的方式进行。通过使用至少一个神经网络分成单个音频信号,尤其是分成与单个声源相关联的音频信号,是本创新技术的独立方面,与至少两个不同神经网络的顺序布置无关。
[0011]示例性输入信号可以包括连续记录的音频数据的最后几毫秒。例如,在传统的音频信号具有每秒采样次数为16000的情况下,输入信号可以包括大约128次采样。输入信号可以表示为矩阵,矩阵的行数对应采样次数,并且矩阵的列数对应输入信号中的通道数。
[0012]借助至少一个第一神经网络对输入信号的调节可以被视为准备步骤的部分。特别优选地,调节精确地受一个第一神经网络影响。已经发现这是实用的,因为它允许对输入信号进行标准处理,而不管其构成(例如被组合在其中的通道和/或音频信号)如何。除了通过使用至少一个第一神经网络进行调节之外,还可以进行输入信号的常规调节。例如,可以使输入信号(尤其是输入信号包含的多个通道)标准化。
[0013]输入信号的调节具有以下优点:从输入信号中分离一个或多个音频信号不需要使用音频格式。准确地说,可以将输入信号的张量形式的表示传递到至少一个第二神经网络。在当前情况下,可以进行高效且明确的分离。
[0014]至少一个第二神经网络可以输出可变数量的音频信号。优选地,至少一个第二神经网络具有固定数量的输出。当使用多个第二神经网络进行分离时,每个第二神经网络都可以具有固定数量的输出。在这种情况下,用于分离音频信号的每个第二神经网络输出从输入信号中分离的固定数量的音频信号。因此,分离的音频信号的数量与用于分离的第二神经网络的数量以及与各个输出数量成比例。例如,所有的第二神经网络可以具有三个输出。以这种方式,例如,当使用两个第二神经网络进行分离时,能够最多从输入信号中分离出六个不同的音频信号。然而,每个不同的第二神经网络也可以生成不同数量的输出。以这种方式,可以更加灵活地规定通过使用至少一个第二神经网络从输入信号中分离出的音频信号的数量。
[0015]由第二神经网络输出的音频信号可以被任意地编码。然而,按顺序执行调节和分离的另一优点在于,至少一个第二神经网络的输出本身可以被编码为音频数据或音频数据的前体。音频信号本身可以由至少一个第一神经网络优化或调节以在至少一个第二神经网络中使用。例如,第一神经网络输出的经调节的音频信号可以由至少一个第二神经网络转换成多个新的音频信号。这意味着至少一个第二神经网络能够以生成方式运行。
[0016]根据本创新技术所述的信号处理装置可以优选地用于至少一个听力装置的音频信号处理。信号处理装置尤其可以是听力装置或其组件。听力受损的用户可以从根据本创新技术所述的信号处理装置产生的音频信号处理的改善中受益。本创新技术意义上的听力装置可能包括助听器、听力植入物,尤其是耳蜗植入物和/或听觉脑干植入物,和/或可听戴设备。示例性助听器包括耳后式助听器、耳内式助听器、耳道内助听器、助听镜和/或骨锚式助听器。示例性的可听戴设备包括智能耳机。
[0017]根据本创新技术的一个有利方面,信号处理装置被配置用于增强从输入信号中分离的一个或多个音频信号。信号处理装置优选地被配置用于音频信号的声音增强。声音增强的音频信号可以产生更清楚的输出信号(例如具有改善的信噪比)。尤其是,信号处理装置被配置用于对一个或多个音频信号去噪。当信号处理用于至少一个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于处理音频信号的信号处理装置(4),具有1.1.用于接收输入信号(E)的输入接口(13),1.2.用于调节所述输入信号(E)的至少一个第一神经网络(10),1.3.用于从所述输入信号(E)中分离一个或多个音频信号(a,b1,b2,c,d)的至少一个第二神经网络(11),以及1.4.用于输出输出信号(O)的输出接口(14),1.5.其中为了处理所述输入信号(E),所述至少一个第一神经网络(10)和所述至少一个第二神经网络(11)按顺序排列。2.根据权利要求1所述的信号处理装置(4),其特征在于,所述信号处理装置(4)被配置为增强从所述输入信号(E)中分离的一个或多个音频信号(a,b1,b2,c,d)。3.根据权利要求1或2所述的信号处理装置(4),其特征在于,设有多个第二神经网络(11),其中每个所述第二神经网络(11)是针对特定类型的音频信号(a,b1,b2,c,d)来定制的。4.根据前述权利要求中任一项所述的信号处理装置(4),其特征在于,并行使用至少两个第二神经网络(11),以从所述输入信号(E)中分离所述音频信号(a,b1,b2,c,d)。5.根据前述权利要求中任一项所述的信号处理装置(4),其特征在于,所述至少一个第二神经网络(11)是能替换的。6.根据前述权利要求中任一项所述的信号处理装置(4),其特征在于,所述至少一个第一神经网络(10)和所述至少一个第二神经网络(11)是联合神经网络的部分。7.根据前述权利要求中任一项所述的信号处理装置(4),其特征在于,设有用于接收用户输入和/或用于向用户输出信息的用户接口(18)。8.根据前述权利要求中任一项所述的信号处理装置(4),其特征在于,设有至少一个数据存储器(15,17),用于存储已知类型的音频信号(a,b1,b2,c,d)。9.一种根据前述权利要求中任一项所述的信号处理装置(4)的用途,用于至少一个听力装置(2,3)的音频信号处理。10.一种用于处理音频信号的系统,具有10.1.至少一个根据权利要求1至8中任一项所述的用于处理音频信号(a,b1,b2,c,d)的信号处理装置(4),10.2.用于记录输入信号(E)的至少一个记录装置(6,19),其中所述记录装置(6,19)经由所述输入接口(13)以数据传输的方式连接到所述信号处理装置(4),以及10.3.用于播放输出信号(O)的至少一个播放装置(7),其中所述播放装置(7)经由所述输出接口(14)以数据传输的方式连接到所述信号处理装置(4)。11.根据权利要求10所述的系统,其特征在于,所述系统是听力装置系统(1)。12.根据权利要求11所述的系统,其特征在于,其包括用于传统音频处理的至少一个器件(40)。13.根据权利要求1...

【专利技术属性】
技术研发人员:彼得
申请(专利权)人:索诺瓦有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1