音频信号再生方法和再生装置制造方法及图纸

技术编号:3041178 阅读:186 留言:0更新日期:2012-04-11 18:40
本发明专利技术目的是即使对于由低编码位速率造成的音频信号,也可以通过在解码一侧插入高频区分量而减少质量的下降。音频信号被解码为频率分量x[0]~x[M](步骤2)。基于相互相关值C,从被解码的频率成分x中检索出作为用于在高频区中插入的基准的频率分量区域(步骤4到步骤13),步骤13的比较结果,在k比M-2N+1大的情况下,结束检索。接着,算出(√(Pr/PK)×x[M-N-K+i])作为频率分量x[M+i](步骤16)。在步骤16中,给作为基准的频率分量提供一定的衰减后生成插入的频率分量。比较M+i和Mth(步骤18)。比较的结果,在M+i比Mth小的情况下,转移到步骤16,进行新的频率分量的生成插入。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及再生压缩音频信号的再生方法和再生装置。在音频信号等压缩记录所使用的编码器中,在频率分量量化中,一般根据频率分量决定量化位数的多少来进行位分配。在这种位分配中,由于限制用于以编码位速率来将频率分量编码所能够使用的位数,因此,要求分配位以便于在这种限制的范围内减少听觉音质的下降。另外,基于频率分量的功率和在某个频带宽度中进行分割的频带中的频率分量的功率之和,考虑人的听觉特性而进行位分配的位数确定。例如,对于符合MPEG-1,MPEG-2音频标准的音频信号的位分配为如下所述。首先,通过考虑频率分量的分布(形状)和表示人们能够感觉的频率分量电平的听觉阈值,计算出每个子频带的屏蔽电平。接着,从屏蔽电平和量化噪音的比变小的子频带开始,重复进行追加处理顺序位,直到量化位总数到达分配的可能值。图6是现有解码器的方框图,表示基于编码的声音压缩技术中解码器基本构成。在输入端输入从编码器传送来的音频信号(数据流),并在频率分量解码器1中将其解码为频率分量。通常频率分量大多采用这种方法,每次分割某个频带宽度,在各个频带上对称为换算系数的值进行标准化,对这种被标准化的值进行量化。在频率分量解码器1中,通过在逆量化上面乘以该换算系数得到该频率分量。所得到的频率分量被提供给逆变换器2,通过逆变换,能够得到被解码的音频信号。在利用编码器的位分配中,基本上,对于功率大的频率分量或者子频带,位数的分配变多了。因此,对于一般的音频信号,在听觉上容易感知,并且,在功率集中的中低范围的频带上,位分配变多。另一方面,在高端频带功率变小,并且,也存在人们听觉特性上难以感知的情况,与中低范围频带相比,位分配变小。但是,这并不表示没有高频再生的必要性。但是,如果编码位速率降低时,位分配用的位总数就减少。结果,以优先在质量贡献多的中低频范围来进行位的分配,在高频范围必须进一步减少本来就少的位分配,这样就导致音质的下降。而且,根据编码位速率,也有高频区子频带或者频率分量分配的位数变为0的情况。也就是,产生未被编码解码的频率分量。不能对高频进行编码解码是与进行带宽限制等同的,听觉质量更加恶化。因此,为了保持听觉质量,即使对与中低频区相比相对数量较少的高频区也要进行位分配。但是,在编码位速率低的情况下,当相对于成为对象的整个频带进行分配时,高频区的位分配相对于中低频区而相对增大。结果,在质量贡献大的中低频区之位分配减少,被解码的音频信号的质量就下降。专利技术概述{这里,写入权利要求17}附图简述图1是表示在本专利技术第一实施例中音频再生方法的流程图。图2是表示在本专利技术第一实施例中频率分量分布的曲线。图3是表示在本专利技术第二实施例中音频再生装置结构的方框图。图4是表示在本专利技术第三实施例中音频再生装置结构的方框图。图5是表示在本专利技术第四实施例中音频再生装置结构的方框图。图6是表示现有技术中音频再生装置之结构例子的方框图。实施例的详细说明下面,参照附图说明本专利技术的实施例。而且,作为本专利技术对象的问题特性,假定在输入音频信号(数据流)中不存在比某个频率更高的高频频率分量。(第一实施例)说明本实施例音频再生方法。图1是说明本实施例中音频再生方法的步骤的流程图。首先,当输入编码压缩的音频信号(数据流)时(步骤1),将输入的音频信号解码为频率分量(步骤2)。而且,步骤2中的解码方法是基于基本编码方法而进行它的逆变换,不限定解码方法。接着,在解码的音频信号内,检索最高的频率分量,假定该频率分量为x[M](M是整数)(步骤3)。而且,假定频率分量从最低的(x)开始以上升顺序分配序号。而后,从频率分量x[M]开始在低频区一侧取出连续N个(N是整数,M>N)频率分量x[M-N+1]~x[M],算出这些的和Pr(步骤4)。接着,通过对频率分量x[M-N+1]~x[M]使用这些的和Pr进行标准化(步骤5),将被标准化的频率分量x[M-N+1]~x[M]设定为X[M-N+1]~x[M]。接着,对保存最大相关值Cmax进行初始设定(Cmax=0)(步骤6)。而后假定k=0(k是整数)(步骤7)。接着,在步骤8到步骤10,不包含在步骤4取出的N个频率分量x[M-N+1]~x[M],取出连续N个频率分量,算出相对于被标准化的频率分量X[M-N+1]~X[M]的一系列功率的相互相关值C。首先,在步骤8,从频率分量x[M-N-k]开始在低频区一侧取出连续N个频率分量x[M-2N+1-k]~x[M-N-k],算出这些的和Pk。而后,使用这些的和Pk对频率分量x[M-2N+1-k]~x[M-N-k]进行标准化(步骤9)。被标准化的频率分量假定为X[M-2N+1]~x[M-N]。之后,相对被标准化的频率分量X[M-N+1]~X[M]的功率系列,计算被标准化的频率分量X[M-2N+1-k]~X[M-N-k]之功率系列的相互相关值Ck(步骤10)。接着,比较最大相互相关值Cmax和算出的相互相关值Ck。比较的结果,如果Ck的值大,就将该Ck值保存为Cmax(步骤11)。而后,假定k=k+1(步骤12)。接着,比较k是否比M-2N+1大(步骤13)。比较的结果,如果k在M-2N+1之下,则再次回到步骤8。对全部的频率分量区域,重复步骤8~步骤11。另一方面,如果k比M-2N+1大,即,如果对全部频率分量区域的检索结束,则转移到步骤14。在这里对于K(K是整数)假定有最大的相互相关值(CK=Cmax)。这种情况下,频率分量x[M-N+1-K]~x[M]变为用于插入高频区的基准频率分量区域。步骤13的比较结果,在k不大于M-2N+1的情况下,如果Cmax不超过阈值Rth(步骤14),不进行下面的外插处理。关于这个处理在随后的第4实施例中详述。如果Cmax超过阈值Rth,决定进行外插,假定i=1(i是整数)(步骤15)。接着,算出(√(Pr/Pk))×x[M-N-K+1],作为频率分量x[M+i](步骤16)。而且,PK是频率分量x[M-2N+1-K]~x[M-N-K]的和。在步骤15,在作为基准之频率分量中提供一定的衰减后,算出插入的频率分量。首先,假设i=i+1(步骤17)。接着,比较M+i和Mth(步骤18)。Mth是再生时所要频率的最大个数,比用于防止返回时变形的变换次数要更小些。比较的结果,在M+i比Mth更小的情况下,返回步骤17,进行新的频率分量的插入。另一方面,在M+i比Mth大的情况下,结束插入处理。在插入Mth以上的数据时,因为有发生返回时变形的可能性,因此不进行该值以上的插入。图2是实行本实施例中步骤时的频率分量分布的曲线。本专利技术中,即使对通过在编码一侧高频区编码变得困难的低编码位速率而被编码的音频信号,通过在解码一侧生成插入高频区成分,也能够用期望的信息量解码再生该音频信号。由此,能够减少再生时听觉质量的下降。而且,如果考虑在解码一侧使用如本专利技术的高频区成分的生成/插入步骤,则在编码一侧有可能在对质量贡献大的中频区/低频区进行重点位分配。另外,在图1表示的流程图中,对于全部的频率分量,进行重复步骤8~步骤11,设置例如对于相互相关值的阈值Cr,如果算出的相互相关值Ck超过阈值Cr,则结束步骤8~步骤11的检索处理,转移到步骤15。这种情况下,假定超过阈值Cr之时(假定本文档来自技高网...

【技术保护点】
一种音频信号再生方法,特征在于具有:将音频信号变换成多个频率分量的步骤,从所述多个频率分量中检索出基准频率分量区域的步骤,衰减所述基准频率分量区域中至少一个基准频率分量的功率,将它作为比所述基准频率分量区域高的高频区一侧的频率成 分插入的步骤,将所述插入的频率分量变换成时间分量的步骤。

【技术特征摘要】
【国外来华专利技术】JP 2002-3-6 2002-0597391 一种音频信号再生方法,特征在于具有将音频信号变换成多个频率分量的步骤,从所述多个频率分量中检索出基准频率分量区域的步骤,衰减所述基准频率分量区域中至少一个基准频率分量的功率,将它作为比所述基准频率分量区域高的高频区一侧的频率成分插入的步骤,将所述插入的频率分量变换成时间分量的步骤。2 权利要求1的音频信号再生方法,特征在于所述检索步骤对所述多个频率分量中的高频区一侧的第1频率分量区域检索功率谱相关性最高的第2频率分量区域,将比含有第1频率分量区域之第2频率分量区域高的高频区一侧的区域作为基准频率分量区域。3 权利要求2的音频信号再生方法,特征在于所述插入步骤根据基于所述第1和第2频率分量算出的值来衰减所述基准频率分量的功率。4 权利要求2的音频信号再生方法,特征在于所述插入步骤以1以下的规定值范围来衰减所述基准频率分量的功率。5 权利要求3的音频信号再生方法,特征在于在所述算出的值超过1的情况下,所述插入步骤替换所述算出的值,以1以下的规定值范围来衰减所述基准频率分量的功率。6 权利要求2的音频信号再生方法,特征在于所述插入步骤在所述插入频率分量之插入序号超过最大插入值的情况下,终止新的频率分量的插入。7 一种音频信号再生装置,特征在于包括将音频信号解码为频率分量的频率分量解码器,从所述频率分量中检索出用于插入到高频区一侧的基准频率分量区域的频率分量区域检索装置,基于所述基准频率分量区域,取出基准频率分量的基准频率分量取出装置,衰减所述基准频率分量的功率...

【专利技术属性】
技术研发人员:神庭進
申请(专利权)人:株式会社东芝
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1