用于将声音帧分离成为正弦分量和残余噪声的方法技术

技术编号:2559595 阅读:214 留言:0更新日期:2012-04-11 18:40
一种从所提供的第一声音帧中确定表示正弦分量的第二声音帧以及可选的表示残余的第三声音帧的方法,该方法包括步骤:    ·在未提取的分量中确定第一声音帧中的正弦分量;    ·为该第一声音帧确定重要性测量;    ·从该第一声音帧提取正弦分量,并且将该正弦分量结合在第二声音帧中;和    ·重复所述步骤,直到该重要性测量满足停止标准;    其中在步骤300之前、或者在步骤300与400之间执行为第一声音帧确定重要性测量的步骤。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种从所提供的第一声音帧来确定表示正弦分量的第二声音帧以及表示残余的可选的第三声音帧的方法。本专利技术也涉及一种用于执行该方法的计算机系统。本专利技术进一步涉及一种用于执行该方法的计算机程序产品。另外,本专利技术涉及一种设备,其包括用于执行所述方法的步骤的装置。
技术介绍
US6298322公开了一种使用主要音调信号和矢量量化的残余音调信号对音调音频信号进行编码和合成的方法。该编码器为所限制数目的音调音频信号的主要正弦分量确定时变频率、幅度和相位,以形成主要正弦参数序列。从音调音频信号中除去这些(主要)分量,以形成残余音调信号。使用所谓的残余音调信号编码器(RTSE)编码所述残余音调信号。在对音频信号进行正弦加残余编码中,音频信号被分割,并且通过正弦部分加残余部分模拟每一帧,这是公知常识并且是上面所提到现有技术的常识。该正弦部分典型地是正弦分量之和。在大多数正弦编码器中,将该残余假定为随机信号,并可以通过噪声模拟。当是这种情况时,该信号的正弦部分应该构成原始帧的所有确定性(即音调)分量。如果该正弦部分并不构成所有的音调分量,某些音调分量会通过噪声模拟。因为噪声并不适合模拟音调,这样就会引入假象。如果正弦部分不仅仅构成该确定性部分,正弦分量就对噪声进行模拟。由于两个原因,这并非所想要的。一方面,正弦并不适合于模拟噪声信号,并且会出现假象。另一方面,如果不通过噪声模拟这些分量,将会得到更多的压缩。现有技术的现状给出某些解决这一问题的方法,即如何较好地划分成为正弦部分和残余部分。S.N.Levine.Audio Representation for Data Compression andCompressed Domain Processing.Ph.D.Dissertation,StanfordUniversity,1998。S.N.Levine,J.O.Smith,“Improvements to the switchedparametric&transform audio coder”,in Proc.1999 IEEE onApplications of Signal Processing to Audio and Acoustics,1999,pp.43-46。S.N.Levine,and J.O.Smith III,“Improvements to theswitched parametric&transform audio coder”in Proc.1999 IEEEWorkshop on Applications of Signal Processing to Audio andAcoustics,New Paltz,New York,Oct.17-20,1999,pp.43-46。G.Peeters,and X.Rodet,“Signal Characterisation in termsof Sinusoidal and Non-Sinusoidal Components”in Proc.DigitalAudio Effects,Barcelona,Spain,19-21 November 1998。X.Rodet,“Musical Sound Signal Analysis/SynthesisSinusoidal+Residual and Elementary Waveform Models”in Proc.IEEE Time-Frequency and Time-Scale Workshop (TFTS′97),University of Warwick,Coventry,UK,27th-29th August 1997。某些方法完全是根据信号的特性。G.Peeters,and X.Rodet,“Signal Characterisation in termsof Sinusoidal and Non-Sinusoidal Components”in Proc.DigitalAudio Effects,Barcelona,Spain,November 1998。X.Rodet,“Muscial Sound Signal Analysis/SynthesisSinusoidal+Residual and Elementary Waveform Models”in Proc.IEEE Time-Frequency and Time-Scale Workshop(TFTS′97),University of Warwick,Coventry,UK,27th-29th August 1997。其它的则更多的是基于心理声学的考虑。S.N.Levine.Audio Representation for Data Compression andCompressed Domain Processing.Ph.D.Dissertation,StanfordUniversity,1998。S.N.Levine,J.O.Smith,“Improvements to the switchedparametric&transform audio coder”in Proc.1999 IEEE onApplications of Signal Processing to Audio and Acoustics,1999,pp.43-46。S.N.Levine,and J.O.Smith III,“Improvements to theswitched parametric&transform audio coder”in Proc.1999 IEEEWorkshop on Applications of Signal Processing to Audio andAcoustics,New Paltz,New York,Oct.17-20,1999,pp.43-46。不幸的是,要分离成正弦部分和残余部分并不容易,并且这些方法没有一个能够给出完全满意的结果(例如参见G.Peeters,and x.Rodet,“Signal Characterisation in terms of Sinusoidal andNon-Sinusoidal Components”in Proc.Digital Audio Effects,Barcelona,Spain,November 1998)。因此当前专利技术的目的是在输入信号的确定性部分和随机部分之间具有较好的分离,以避免出现假象并为了在接下来对所分离的信号进行压缩中得到最优并高效的压缩或编码。
技术实现思路
所述目的的实现需要在开始段落中所提到的方法包括下面的步骤·在未提取的分量中确定第一声音帧中的正弦分量;·为该第一声音帧确定重要性测量;·从该第一声音帧提取正弦分量;并且将该正弦分量包括在第二声音帧中;和·重复所述步骤,直到该重要性测量满足停止标准。该所述方法具有多个高于上述现存方法的优点。引入到该编码阶段中的额外复杂度几乎为零。而且,该复杂度还可以降低,因为在最后步骤中该方法表明何时停止提取正弦本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:N·H·范施恩德M·格梅滋富恩特斯R·霍伊斯登斯
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利