适应性多阶步进的时序转换方法技术

技术编号:3041084 阅读:168 留言:0更新日期:2012-04-11 18:40
一种适应性多阶步进的时序转换方法,用来将S↓[1][n]及S↓[2][n]合成为S↓[3][n],该方法包含下列步骤:    (a)计算S↓[1][n]及S↓[2][n]对应于第一索引值的第一相关值;    (b)比较该第一相关值与临界值;    (c)若该第一相关值小于该临界值,则计算S↓[1][n]及S↓[2][n]对应于该第一索引值之后的第一数目个索引值所对应的相关值;若该第一相关值大于该临界值,则计算S↓[1][n]及S↓[2][n]对应于该第一索引值之后的第二数目个索引值所对应的相关值;以及    (d)依据计算出的最大相关值所对应的最大索引值、S↓[1][n]及S↓[2][n]产生S↓[3][n]。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术提供一种信号合成方法,特别是一种应用于时序转换(time scaling)的适应性多阶步进方法。
技术介绍
随着科技的进步,一些如卡拉OK之类的影音播放装置所能提供的功能也越来越多,例如像是音效净化(audio clean-up)、梦幻音场(dream)、及时序转换(time scaling)等功能。所谓的时序转换(又称为time stretching、time compression/expansion或timecorrection)是在不影响声调(pitch)的情况下,改变音频信号的长度,即改变该音频信号的播放速率(tempo)。目前,市面上的影音装置大都通过以下的三种方法以完成时序转换,一种是相位声码器(Phase Vocoder)、一种是MPEX(MinimumPerceived Loss Time Expansion/Compression)、而另一种则是TimeDomain Harmonic Scaling(TDHS)。Phase vocoder先利用STFT(ShortTime Fourier Transform)的方式将音频信号转换成傅立叶形式的频域信号(complex Fourier representation),再利用内差及iSTFT(逆STFT)的方式将该频域信号转换成对应于该音频信号的时序转换过(time scaled)的音频信号。MPEX是近来由Prosoniq所研发出来的,MPEX是一种模拟人类听觉特性的方法,类似于人工神经网络(artificial neural network)。MPEX依据特定时段内所收录的音频信号,并进而″学习″该特定时段内的音频信号的各种特性,以试图延长或缩短该音频信号。而TDHS则为一种较普遍的时序转换的方法,其先计算第一音频信号的相关表(autocorrelogram)中的每一相关值(magnitudes of a autocorrelation function),接着依据该相关表中的最大相关值所对应的最大索引值延迟该第一音频信号以产生第二音频信号,然后再将该第一音频信号以同步叠加(synchronized overlap-add,SOLA)的方式复制于该第二音频信号上,以产生一较第一音频信号更长的第三音频信号。请参阅图1,图1为现有TDHS的相关表10,相关表10包含多个相关值R(τ)。一般说来,除了最大相关值12及其附近的相关值较大外,相关表10中其余的相关值皆很小,并且相关表10中两相邻相关值的变化也不太大,也就是,若第一相关值14远较最大相关值12小,则相邻于第一相关值14的第二相关值16也会远小于最大相关值12,对应地,第二相关值16所对应的第二索引值τ2也会距离最大相关值12所对应的索引值τmax很远;反之,若一第三相关值18与最大相关值12间之差异不大时,则相邻于第三相关值18的第四相关值20就可能较接近最大相关值12,对应地,第四相关值20所对应的第四索引值τ4可能(为图1中两组第三相关值18及第四相关值20中的一组)将接近于最大索引值τmax。相关表10通过数字信号处理器(DSP)来建立,而DSP是专门作为处理如卷积计算(convolution)、快速傅立叶转换(fast Fouriertransform,FFT)等复杂的数学运算之用。虽然如此,为了找出最大相关值12及其所对应的最大索引值τmax,而使用DSP计算出相关表10中的所有相关值的过程不仅冗长而且完全没有必要。
技术实现思路
因此本专利技术的主要目的在于提供一种,以期快速地找出对应于S1[n]及S2[n]的最大索引值τmax,以合成S1[n]及S2[n]。根据本专利技术的一个方面,本专利技术公开一种,用来将S1[n]及S2[n]合成为S3[n],该方法包含下列步骤(a)计算S1[n]及S2[n]对应于第一索引值的第一相关值;(b)比较该第一相关值与临界值;(c)若该第一相关值小于该临界值,则计算S1[n]及S2[n]对应于该第一索引值之后的第一数目个索引值所对应的相关值;若该第一相关值大于该临界值,则计算S1[n]及S2[n]对应于该第一索引值之后的第二数目个索引值所对应的相关值;以及(d)依据计算出的最大相关值所对应的最大索引值、S1[n]及S2[n]产生S3[n]。在本专利技术的优选实施例中,该第一数目大于1,而该第二数目等于1。根据本专利技术的另一个方面,本专利技术公开一种,用来将S1[n]及S2[n]合成为S3[n],该方法包含下列步骤(a)将S2[n]延迟预定数目以形成S5[n];(b)计算S1[n]及S5[n]对应于第一索引值的第一相关值;(c)比较该第一相关值与一临界值;(d)若该第一相关值小于该临界值,则计算S1[n]及S5[n]对应于该第一索引值之后的第一数目的索引值所对应的相关值;若该第一相关值大于该临界值,则计算S1[n]及S5[n]对应于该第一索引值之后的第二数目的索引值所对应的相关值;以及(e)依据计算出的最大相关值所对应的最大索引值、S1[n]及S5[n]产生S3[n]。由于本专利技术的方法在建立相关于S1[n]及S2[n]的相关表时,不需一一计算该相关表中所有的相关值,因此可节省用来建立该相关表的DSP计算该相关值所需花费的时间,所以,也增加该DSP所在的计算机的计算效能。附图说明图1为现有TDHS的相关表。图2为本专利技术方法的相关表。图3为本专利技术方法的流程图。图4为本专利技术方法将S1[n]及S2[n]合成为S3[n]的示意图。图5为本专利技术方法增长音频信号的示意图。图6为本专利技术方法缩短音频信号的示意图。附图标记说明10、30 相关表12最大相关值14 第一相关值16第二相关值18 第三相关值20第四相关值Th1第一临界值Th2第二临界值 Th3第三临界值具体实施方式在建立对应于第一音频信号及第二音频信号的相关表的过程中,本专利技术的优选实施例中的方法100是依据该相关表中索引值所对应的相关值与第一临界值th1及第二临界值th2间的大小关系,其中第一临界值th1是小于第二临界值th2,来计算该相关表中位于该索引值后的索引值所对应的相关值。详而言之,若该相关表中第一相关值R(τ1)小于第一临界值th1,代表第一相关值R(τ1)所对应的第一索引值τ1距该相关表中最大相关值R(τmax)所对应的最大索引值τmax仍有一段距离,则计算位于第一索引值τ1后的第一预定数目Δ1的第二索引值τ2所对应的第二相关值R(τ2);若该相关表中第三相关值R(τ3)大于第一临界值th1但小于第二临界值th2,代表第三相关值R(τ3)所对应的第三索引值τ3较第一索引值τ1更为接近最大索引值τmax,则计算位于第三索引值τ3后的第二预定数目Δ2的第四索引值τ4所对应的第四相关值R(τ4),其中第二预定数目Δ2小于第一预定数目Δ1;若该相关表中第五相关值R(τ5)大于第二临界值th2,代表第五相关值R(τ5)所对应之的第五索引值τ5已相当接近最大索引值τmax,则计算紧接于第五索引值τ5后的第六索引值τ6所对应的第六相关值R(τ6)。请参阅图2及图3,图2为本专利技术的优选实施例中的方法100所对应的相关表30,图3为本专利技术的方法100的流程图。方法100包含下列步骤步骤102开始;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种适应性多阶步进的时序转换方法,用来将S1[n]及S2[n]合成为S3[n],该方法包含下列步骤(a)计算S1[n]及S2[n]对应于第一索引值的第一相关值;(b)比较该第一相关值与临界值;(c)若该第一相关值小于该临界值,则计算S1[n]及S2[n]对应于该第一索引值之后的第一数目个索引值所对应的相关值;若该第一相关值大于该临界值,则计算S1[n]及S2[n]对应于该第一索引值之后的第二数目个索引值所对应的相关值;以及(d)依据计算出的最大相关值所对应的最大索引值、S1[n]及S2[n]产生S3[n]。2.如权利要求1所述的方法,其中S1[n]所包含的信号个数为N1,而S2[n]所包含的信号个数为N2,步骤(d)中,S1[n]是加权合成于S4[n]以产生S3[n],S4[n]是将S2[n]延迟该最大索引值。3.如权利要求2所述的方法,其中S3[n]=S1[n],当0<=n<该最大索引值时;S3[n]=(N1-n)/(N1-该最大索引值)*S1[n]+(n-该最大索引值)/(N1-该最大索引值)*S4[n-该最大索引值],当该最大索引值<=n<N1时;S3[n]=S4[n-该最大索引值],当N1<=n<=N2该最大索引值。4.如权利要求1所述的方法,其中步骤(c)还包括(e)将跳过的索引值的相关值设定为零。5.如权利要求1所述的方法,其还包括(f)依据该最大相关值更新该临界值。6.如权利要求1所述的方法,其中S1[n]及S2[n]分别取样自S1(t)及S2(t)。7.如权利要求6所述的方法,其中S1(t)及S2(t)分离自原始信号。8.如权利要求7所述的方法,其中该原始信号是音频信号。9.如权利要求7所述的方法,其中该原始信号是视频信号。10.如权利要求7所述的方法,其中S1(t)等于S2(t)。11.如权利要求7所述的方法,其中S1(t)不等于S2(t)。12.如权利要求...

【专利技术属性】
技术研发人员:吴俊德
申请(专利权)人:扬智科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1