对根据心理声学模型幅度小于掩蔽值的正弦信号有效编码的编码方法和设备以及对编码的正弦信号解码的解码设备和方法技术

技术编号:5382730 阅读:261 留言:0更新日期:2012-04-11 18:40
提供了一种对根据心理声学模型幅度小于掩蔽值的正弦信号进行有效编码的编码方法和设备,用于对编码的正弦信号进行解码的解码设备和方法,以及具有在其上记录有用于执行所述编码方法/解码方法的程序的计算机可读记录介质。通过使用指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定代码对第一正弦信号进行编码,使用根据使用特定代码的方法选择的一个正弦信号或者多个正弦信号来执行对与第一正弦信号连接的下一帧的第三正弦信号的差分编码,解码设备使用选择的正弦信号通过发送的差获得和。

【技术实现步骤摘要】
【国外来华专利技术】
本申请要求于2007年8月16日提交到韩国知识产权局的第10-2007-82287号韩 国专利申请的优先权,其公开完整地包含于此,以资参考。 与本专利技术一致的方法和设备总体涉及处理音频信号,更具体地讲,涉及对根据心 理声学模型(psychoacoustic model)巾畐度(magnitude)小于掩蔽值(masking value)的 正弦信号进行编码以及对编码的正弦信号进行解码。
技术介绍
参数编码(parametric coding)通过特定参数表示音频信号,参数编码用于运动 图像专家组(MPEG)-4标准。 在参数编码中,通过执行三种类型的分析(即,瞬态分析、正弦分析和噪声分析) 提取在每个域中的音频分量的参数。将提取的分量格式化为比特流以发送到解码器。 在正弦分析之后,对正弦信号进行跟踪以针对正弦信号进行自适应差分脉冲编码 调制(ADPCM)编码或差分脉冲编码调制(DPCM)编码。跟踪是从包括在先前帧和下一帧中 的正弦分量中搜索相互连续的正弦分量并设置找到的正弦分量之间的对应关系的过程。 可从先前帧的正弦分量跟踪的当前帧的正弦分量称为连续(conti皿ation)正弦 分量。由于可使用与连续正弦分量对应的先前帧的正弦分量对连续正弦分量执行差分编 码,所以可有效地对连续正弦分量进行编码。与下一帧的正弦分量不连续并消失的连续正 弦分量称作终止(death)正弦分量。 另一方面,无法从先前帧的正弦分量跟踪的当前帧的正弦分量称为新生(birth) 正弦分量。无法对新生正弦分量执行使用先前帧的正弦分量的差分编码,并且可对新生正 弦分量执行绝对编码。因此,新生正弦分量需要大量比特以进行编码。 在对音频数据进行编码中,试图使用心理声学模型减少编码的数据的比特数。图 1A是解释根据心理声学模型的掩蔽效果的示图。 如图1A所示,当存在特定音频信号4时,人耳听不见信号幅度小于音频信号4的 幅度的声音。在特定音频信号4存在的情况下,表示人耳可听见的信号的最小幅度的线被 称作掩蔽曲线2,在特定频率处的掩蔽曲线2的值被称为掩蔽值。 参照图1A,正弦信号6的幅度大于掩蔽值,因此人耳可听到正弦信号6。因此,必 须对正弦信号6进行编码。 另一方面,正弦信号8的幅度小于掩蔽值,因此人耳无法听到正弦信号8。因此,在 使用心理声学模型的编码中不对正弦信号8进行编码。换言之,使用心理声学模型的编码 将幅度比掩蔽值小的正弦信号处理为不存在。 图1B是解释在正弦跟踪中如何处置(treat)根据心理声学模型幅度比掩蔽值小 的正弦信号的示图。6 参照图1B,正弦信号10具有根据心理声学模型小于掩蔽值的幅度。正弦信号10 的幅度小于在与正弦信号10相同帧中的正弦信号18和20的幅度。 当不应用心理声学模型时,正弦信号10与先前帧的正弦信号12和下一帧的正弦 信号14连接。因此,执行正弦信号12、正弦信号IO和正弦信号14的跟踪,因此可对正弦信 号14执行可应用到连续正弦信号的差分编码。 然而,当应用心理声学模型时,如在空位置16中视为没有任何信号一样,将幅度 小于掩蔽值的信号视为不存在。 当应用心理声学模型时,将正弦信号10视为不存在,因此将正弦信号14视为新生 正弦信号,需要大量比特以进行编码。 如果将根据心理声学模型幅度比掩蔽值小的信号视为不存在,则必须将下一帧的 正弦信号作为新生正弦信号进行编码。 此外,即使对幅度小于掩蔽值的这些信号进行编码,仍出现问题。 图2是示出用于处理根据心理声学模型幅度小于掩蔽值的信号的现有方法的流程图。 首先,在操作S10执行正弦跟踪。假设,作为正弦跟踪的结果,P(n-2)与P(n-l)连 接,P(n-l)与P(n)连接。 在操作S20,将P(n-l)假设为根据心理声学模型幅度小于掩蔽值的信号。这样的 信号可具有较小值或0的振幅(amplitude)。 在操作S30,根据应用或不应用心理声学模型的前述两种方法确定是否对P (n-l) 进行编码。 当应用心理声学模型并因此将P (n-l)视为不存在时,在操作S40不对P (n_l)进 行编码,并在操作50根据用于新生正弦信号的解码方法对作为下一帧的正弦信号的P(n) 进行绝对编码。 当确定对P(n-l)进行编码时,在操作S60根据用于连续正弦信号的编码方法执行 P(n-l)与P(n-2)之间的差分编码,并在操作S70执行P(n)与P(n-l)之间的差分编码。 如上所述,当在操作S40中对P(n-l)不进行编码时,由于将用于新生正弦信号的 编码方法应用到P (n),所以需要大量的比特以对振幅、频率和相位分量进行编码。 当在操作S60中对P(n-l)进行编码时,用于对频率或振幅分量进行编码的比特数 较少。然而,由于P(n-l)的振幅小或等于O,所以P(n-l)的振幅与P(n-2)的振幅之差很 大。此外,P(n-l)的振幅与P(n)的振幅之差很大。因此,大量的比特可被用于对所述差进 行编码或者所述差可能在无法表示的范围内。 这样,为了使用现有方法对包括根据心理声学模型幅度小于掩蔽值的正弦信号的 音频信号进行编码,,需要比一般正弦信号的编码的情况下更多数量的比特,降低编码效率。 专利技术公开 技术方案 本专利技术提供一种对根据心理声学模型幅度小于掩蔽值的正弦信号进行有效编码的编码方法和设备以及用于对编码的正弦信号进行解码的解码设备和方法。 有益效果7 如上所述,根据本专利技术示例性实施例,通过使用指示根据心理声学模型第一正弦 信号的幅度比掩蔽值小的特定代码(code)对第一正弦信号编码,根据使用特定代码的方 法,仅使用与第一正弦信号连接的先前帧的第二正弦信号或者使用第一正弦信号和第二正 弦信号,执行对与第一正弦信号连接的下一帧的第三正弦信号的差分编码,解码设备使用 根据特定代码的类型选择的一个正弦信号或多个正弦信号对第三正弦信号进行解码。 另一方面,现有方法使用第一正弦信号对第三正弦信号的所有分量执行绝对编码 或差分编码,以对第三正弦信号进行编码。 因此,与现有方法相比,可减少编码所需的比特的数量,从而可获得有效地编码。 附图说明 通过参照附图对本专利技术示例性实施例进行详细描述,本专利技术的上述和其它方面将 会变得更清楚,其中 图1A是解释根据心理声学模型的掩蔽(masking)效国的示图; 图IB是解释在正弦跟踪中如何处置根据心理声学模型的幅度比掩蔽值小的正弦信号的示图; 图2是示出用于处理根据心理声学模型幅度小于掩蔽值的信号的现有方法的流 程图; 图3是示出根据本专利技术示例性实施例的对正弦信号进行编码的编码方法的流程 图; 图4是根据本专利技术示例性实施例的用于对正弦信号进行编码的编码设备的框图; 图5示出与仅使用第二正弦信号对第三正弦信号进行编码对应的曲线; 图6示出与使用第一正弦信号和第二正弦信号对第三正弦信号进行编码对应的曲线; 图7是根据本专利技术示例性实施例的用于对正弦信号进行解码的解码设备的框图。 最佳模式 根据本专利技术的一方面,提供了一种对正弦信号进行编码的编码方法。所述编码方 法包括对包括第一正弦信号的音频信号执行正弦跟踪,以从包括第一正弦信号的当前帧 之前的先前帧的正弦信号中确定第二正弦信号,从当前帧之后的下一帧的正弦信号中确定 第三正弦信本文档来自技高网...

【技术保护点】
一种对正弦信号进行编码的方法,所述方法包括:对包括第一正弦信号的音频信号执行正弦跟踪,以从包括第一正弦信号的当前帧之前的先前帧的正弦信号中确定第二正弦信号,从当前帧之后的下一帧的正弦信号中确定第三正弦信号,其中,第一正弦信号的幅度根据心理声学模型小于掩蔽值,第二正弦信号和第三正弦信号连接到第一正弦信号;使用特定代码对第一正弦信号进行编码,其中,所述特定代码指示第一正弦模型的幅度根据心理声学模型小于掩蔽值;以及通过仅使用第二正弦信号或使用第一正弦信号和第二正弦信号执行对第三正弦信号的差分编码来对第三正弦信号进行编码。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:李男淑李健炯李撤雨文瀚吉
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:KR[韩国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1