【技术实现步骤摘要】
【国外来华专利技术】通过使用音频频谱图上的结构张量来重构相位信息的编码
本专利技术涉及音频信号处理,具体地,涉及使用频谱图上的结构张量进行谐波-冲击-残差(harmonic-percussive-residual)声音分离的装置和方法。
技术介绍
能够将声音分离成其谐波分量和冲击分量是许多应用的有效预处理步骤。尽管“谐波-冲击(-残差)分离”是一个常用术语,但它具有误导性,因为它意味着谐波结构的正弦曲线的频率为基频的整数倍。尽管正确的术语应该是“音调-打击-(残差)分离”,但为了便于理解,下面使用术语“谐波”而不是“音调”。例如,使用音乐录音的分离的冲击分量可以导致节拍跟踪(参见[1])、节奏分析和节奏乐器的转录的质量改善。分离的谐波分量适用于音高乐器和和弦检测的转录(参见[3])。此外,谐波-冲击分离可以用于重新混合目的,例如改变两个信号分量之间的水平比(参见[4]),这会使得实现“更平滑”或“更强”的整体声音感知。用于谐波-冲击声音分离的一些方法依赖于这样的假设:在输入信号的幅度频谱图中,谐波声音具有水平结构(在时间方向上),而冲击声音表现为垂直结构(在频率方向上)。Ono等人提出了一种方法,该方法首先通过在时间/频率方向上的扩散来产生谐波/冲击增强的频谱图(参见[5])。之后通过比较这些增强的表示,可以得到声音是谐波还是冲击的决定。Fitzgerald发表了一种类似的方法,在该方法中,通过在垂直方向上使用中值滤波而不是扩散来计算增强的频谱图是(参见[6]),这产生了类似的结果,同时降低了计算复杂度。受到正弦+瞬态+噪声(S+T+N)信号模型(参见[7]、[8]、[9]) ...
【技术保护点】
1.一种用于根据音频信号的幅度频谱图进行相位重构的装置,包括:频率改变确定器(110),被配置为根据所述音频信号的幅度频谱图,来确定针对所述音频信号的幅度频谱图的多个时频段中的每个时频段的频率的改变;以及相位重构器(140),被配置为根据针对所述多个时频段而确定的频率的改变来产生针对所述多个时频段的相位值。
【技术特征摘要】
【国外来华专利技术】2016.03.18 EP 16161230.41.一种用于根据音频信号的幅度频谱图进行相位重构的装置,包括:频率改变确定器(110),被配置为根据所述音频信号的幅度频谱图,来确定针对所述音频信号的幅度频谱图的多个时频段中的每个时频段的频率的改变;以及相位重构器(140),被配置为根据针对所述多个时频段而确定的频率的改变来产生针对所述多个时频段的相位值。2.根据权利要求1所述的装置,其中,所述相位重构器(140)被配置为:通过对所述频率的改变进行两次积分,来产生针对所述多个时频段中的每个时频段的相位值。3.根据权利要求1或2所述的装置,其中,所述相位重构器(140)被配置为:根据下式产生针对所述多个时频段的相位值:其中,b0是指示多个块中的分析块的索引,其中,b是指示所述多个块中的另外的分析块的另外的索引,其中,H指示跳大小,以及其中,φ(bH)、φb(b0)以及φbb(m)指示相位值。4.根据前述权利要求中之一所述的装置,其中,所述频率改变确定器(110)被配置为:根据针对所述多个时频段中的每个时频段的角度α(b,k),确定针对所述时频段的频率的改变,其中针对所述时频段的角度α(b,k)取决于所述音频信号的幅度频谱图。5.根据权利要求4所述的装置,其中,所述频率改变确定器(110)被配置为:进一步根据所述音频信号的采样频率(fs)、根据分析窗口的长度(N)、以及根据所述分析窗口的跳大小(H),来确定针对所述多个时频段中的每个时频段的频率的改变。6.根据权利要求5所述的装置,其中,所述装置的频率改变确定器(110)被配置为:根据下式来确定针对所述多个时频段中的每个时频段的频率的改变:其中,(b,k)指示所述多个时频段中的时频段,其中,R(b,k)指示针对所述时频段(b,k)的频率的改变,其中,b指示时间,其中,k指示频率,其中,fs指示所述音频信号的采样频率,其中,N指示所述分析窗口的长度,其中,H指示所述分析窗口的跳大小,以及其中,α(b,k)指示针对所述时频段(b,k)的角度,其中所述角度α(b,k)取决于所述幅度频谱图。7.根据权利要求4至6之一所述的装置,其中,所述频率改变确定器(110)被配置为:确定所述音频信号的幅度频谱图(S)关于时间索引的偏导数(Sb),其中,所述频率改变确定器(110)被配置为:确定所述音频信号的幅度频谱图(S)关于时间索引的偏导数(Sk),以及其中,所述频率改变确定器(110)被配置为:根据所述音频信号的幅度频谱图(S)关于所述时间索引的偏导数(Sb)、以及根据所述音频信号的幅度频谱图(S)关于频率索引的偏导数(Sk),来确定针对所述多个时频段中的每个时频段((b,k))的结构张量(T(b,k)),以及其中,所述频率改变确定器(110)被配置为:根据针对所述多个时频段中的每个时频段((b,k))的结构张量(T(b,k)),来确定针对所述时频段((b,k))的角度(α(b,k))。8.根据权利要求7所述的装置,其中,所述频率改变确定器(110)被配置为:通过确定所述多个时频段中的每个时频段((b,k))的结构张量(T(b,k))的特征向量v(b,k)的两个分量v1(b,k)和v2(b,k)、以及通过根据下式确定针对所述时频段((b,k))的角度(α(b,k)),来确定针对所述时频段((b,k))的角度(α(b,k)):其中,α(b,k)指示针对所述时频段((b,k))的角度,其中,b指示时间,其中,k指示频率,以及其中,atan()指示反正切函数。9.根据前述权利要求之一所述的装置,其中,所述相位重构器(140)被配置为:根据针对所述多个时频段而确定的频率的改变,来产生针对所述多个时频段中的每个时频段的相位值。10.根据权利要求7或8所述的装置,其中,所述相位重构器(140)被配置为:根据针对所述多个时频段中的每个时频段而确定的频率的改变,来确定针对所述多个时频段中的每个时频段(b,k)的各向异性的度量。11.根据权利要求10所述的装置,其中,所述相位重构器(140)被配置为:根据下式中的至少一个,来确定针对所述多个时频段中的每个时频段(b,k)的所述各向异性的度量:以及μ(b,k)+λ(b,k)≥e,其中,μ(b,k)是所述时频段(b,k)的结...
【专利技术属性】
技术研发人员:安德鲁斯·尼德梅尔,理查德·福格,萨沙·迪施,
申请(专利权)人:弗劳恩霍夫应用研究促进协会,
类型:发明
国别省市:德国,DE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。