压缩声频信号的处理制造技术

技术编号:3042881 阅读:174 留言:0更新日期:2012-04-11 18:40
描述了衰减MPEG或类似压缩系统中声频数据帧的技术,及不解压即将信号混合的方法。数据帧中每一项具有相关的标度系数索引,用来识别顺序安排并有间隔的标度系数数值表的各项。衰减技术涉及简单地对标度系数索引值进行加法运算,以检索不同的标度系数值。每一通道的各个子带数据组就其各自的标度系数进行比较,并在按比例缩放后将两个组的数据加在一起。最好相当于1dB衰减的标度系数表间距用来在测定出溢出时对相加结果进行快速的按比例缩放。(*该技术在2017年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及声频信号衰减和混合的方法,以及实现这样的方法的设备,尤其涉及,但又不仅仅涉及按MPEG(活动图象专家组)标准压缩和/或编码的声频数据流的混合。正如ISO 11172-3(MPEG1)和ISO 13818-3(MPEG2)定义的,MPEG声频信号的压缩依赖于这样的一个事实,即对于人类某些频率比其他频率听得清楚。声频数据首先从时间域置换成频率域,并分成几个覆盖可闻频率范围的子带。对于每个子带的采样数据依据它被听得清楚的程度,根据MPEG标准中定义的音质模型而被赋予一定量的带宽,它不仅涉及给定瞬间存在的频率,而且涉及到目前为止一直存在的频率。然后,听不太清楚的频率以较低的比特率发送,从而得到压缩的效果。在诸如MPEG,JPEG(联合照相专家组)和视频电话用的H.261标准等压缩技术上,公认的问题是,不首先经过费时的解码步骤,编码的数据就难以处理。在这方面现有的许多工作都集中在压缩视频数据的处理上,正如例如下列文献所描述的”压缩影象处理算法”,作者Brian C.Smith及Lawrence A.Rowe,IEEE Computer Graphics andApplications,Sept.1993,Vol.13(No.5)pp.34-42;“MC-DTC压缩视频的处理和合成”,作者Shih-Fu Chang及David G.Messerschmitt,IEEEJoumel on Selected Area in Communications,Vol.13(No.1)Jan.1995,PP.1-11;以及加里福尼亚大学的Chang等人的国际专利申请WO94/21079。所描述的技术都围绕一些为特定的影象处理类型而研究出的比较复杂的算法,而且在其使用之前至少还需要部分地进行信号解码,例如,以便去除动画补偿。有人提出,在这些算法中对其中的一些或许可以研究用于声频数据。但是,由于压缩视频和声频流(例如带声道的影片)的视频成分总的来说比较复杂,把这些算法应用于已部分解码但仍压缩的视频所需要的时间,足以允许将传统的”强力(brute force)”(亦即,完全解码再编码)技术用于伴音。鉴于在纯声频应用的速度方面和多重声频信号应用(不是与视频分开,就是与视频结合)方面的潜在好处,本专利技术的一个目的是提供一种将信号处理技术应用于压缩数据流的方法和设备。本专利技术的另一个目的是使压缩形式的声频数据流的混合变得容易。按照本专利技术,提供了一种对压缩数字化声频信号施行衰减的方法,其中定义了L个标度系数的第一表,它包括一个具有L个数值的逐级变化的级数,其第二个和其后的每一个值都由前面的值用共同的函数推算出来,每一个标度系数都唯一地由各个标度系数索引值识别,而所述的信号采取顺序的数字数据帧的形式,而每一帧按共同的安排至少包括以下各段-子带数据值,代表该子带或一个或多个子带中的每一个的多个采样点的值,其中该子带或每一个子带代表各自的频率带宽;以及-标度系数索引值,至少一个被赋值给该子带或所述一个或多个子带之中的每一个,并识别准备在信号解压中用于其上的各个数值标度系数;其特征在于,所述标度系数索引值包括L个顺序整数值,而对于该子带或每一个子带,所述方法还包括下列步骤在所述L个数值的序列的M级的情况下,识别出所要求的衰减;并把M加在赋给所述子带的该标度系数索引或每一个标度系数索引上,其中1≤M<L,而L和M都是整数。利用MPEG和类似的编码信号用的标度系数表中的项目规则地逐级变化(stepping),衰减变成了简单的加法。在MPEG的情况下,标度系数表中各项的间距相当于1dB(分贝),因而要衰减0.5(相当于3dB)只需把整数值3加在标度系数索引值上。本专利技术还提供对上述类型的一个或多个压缩数字化声频信号进行混合的方法,该方法还包括对每个信号的各个子带进行的混合,而对于准备混合的该组或每一组子带,它包括下列步骤识别出相关标度系数最大的子带;将相关标度系数较小的该子带或那些子带按比例缩放成与第一个子带处于同一标度范围;并将各组数据值加在一起。在该混合方法之前可以如前所述那样进行衰减,就是说,对至少一对所述的子带,在 所述L个数值序列的M级的情况下,识别出所要求的衰减;以及把M加在赋给所述子带的该标度系数索引或每一个标度系数索引上,其中1≤M<L,而L和M都是整数。子带数据值的按比例缩放可以适当地利用由两个子带的标度系数索引值之差以及所考虑的数据值进行检索的二维检索表。在一帧内最好采用适当地包括个别地决定和应用每个子带用的M(标度系数表索引)的各个值的方法,定义多个代表各频率带宽的子带。作为预防性的特征,若识别相关标度系数较大的子带的步骤表明该标度系数之间的差超过预定的阈值,则最好是对标度系数较小的子带不是进行按比例缩放,而是弃置,而将标度系数较大的子带输出;这等效于一个信号声音大得盖过其他信号。另外,将各组子带数据值相加之后,最好查查看结果是否超过预定个位的长度(溢出状态),若是如此,则对于该结果的标度系数索引可以增大一个整数值,以便对结果进行按比例缩放。参照附图阅读对本专利技术在按MPEG标准压缩的声频信号的方面仅作实例举出的最佳实施例的下列描述之后,本专利技术的其他特征和优点将会变得更加清楚。附图中附图说明图1示意地表示MPEG1标准的声频数据的一帧;图2是示意的方框图,表示体现本专利技术的将两个声频数据流混合的过程;图3和4表示结合图2过程使用的屏幕上的控制面板显示的方案;图5举例说明可以结合本专利技术控制功能使用的屏幕显示形式。如前所述,MPEG声频压缩依赖于这样的一个事实,即对于人类来说,某些频率听得比其他频率清楚,对于听得不那么清楚的频率以比较低比特率发送,以达到压缩的目的。MPEG允许使用多达32个子带来覆盖声频频率范围,每一个MPEG包含有关于每个子带的36个样值,每个子带的数据被赋予各自的带宽。一个MPEG帧包括如图1所安排的数据,帧的每一段含有不同的整数个位。帧头H包括32位,按特定的安排来描述帧的比特率、采样频率、携带单声道还是立体声信息等等。帧头H还包括一位,用来标志是否加有循环冗余检查(CRC);若是加有CRC,则紧跟在帧头段的后面是一个16位的CRC值(未示出)。在帧头H(若有CRC,则在CRC)后面,是子带分配段SBA的数据,识别帧中存在那些子带,同时还指示每个子带样值分配几个位。SBA段是一个整数阵列(每个子带一个),其中的每个整数都是对表示该子带的对数据值的表的索引。在MPEG标准中规定了几个这样的表,关于SBA段的长度和格式的选择取决于比特率和采样频率,例如,64k位流以44.1KHz(千赫)的频率采样。MPEG规定最多27个阵列项(亦即,在可能的32个子带中只有27个),给各阵列项规定了不同的位数;例如,0-10项,4位;11-22项,3位;23-26项,2位。请注意,若在SBA段是0项,这就是说,该子带在帧中不存在,在所有其他段中跳过这一帧的数据。如前所述,子带数据包括每个子带36个样值。压缩过程依次将这些值组成3组,每组12个。对每个组进行分析,以求出其最大(绝对)值,采用6位整数的形式,然后用来从MPEG规定的标度系数表中为该组选择一个标度系数。然后在下一步处理之前将该值除以标度系数。然本文档来自技高网...

【技术保护点】
一种对压缩数字化声频信号施行衰减的方法,其中定义了L个标度系数的第一表,它包括具有L个数值的逐级变化的级数,其第二个和其后的每一个值都由前面的值用共同的函数推算出来,每一个标度系数都唯一地由各个标度系数索引值识别,而所述的信号采取顺序的数字数据帧的形式,而每一帧按共同的安排至少包括以下各段:-子带数据值,代表该子带或一个或多个子带中的每一个的多个采样点的值,其中该子带或每一个子带代表各自的频带宽度;以及-标度系数索引值,至少一个被赋值给该子带或所述一个或多个子带之中的 每一个,并识别准备在信号解压中用于其上的各个数值标度系数;其特征在于,所述标度系数索引值包括L个顺序整数值,而对于该子带或每一个子带,所述方法还包括下列步骤:在所述L个数值的序列的M级的情况下,识别出要求的衰减;并把M加在赋给所述子带的 该标度系数索引或每一个标度系数索引上,其中1≤M<L,而L和M都是整数。

【技术特征摘要】
GB 1996-3-29 9606680.81.一种对压缩数字化声频信号施行衰减的方法,其中定义了L个标度系数的第一表,它包括具有L个数值的逐级变化的级数,其第二个和其后的每一个值都由前面的值用共同的函数推算出来,每一个标度系数都唯一地由各个标度系数索引值识别,而所述的信号采取顺序的数字数据帧的形式,而每一帧按共同的安排至少包括以下各段-子带数据值,代表该子带或一个或多个子带中的每一个的多个采样点的值,其中该子带或每一个子带代表各自的频带宽度;以及-标度系数索引值,至少一个被赋值给该子带或所述一个或多个子带之中的每一个,并识别准备在信号解压中用于其上的各个数值标度系数;其特征在于,所述标度系数索引值包括L个顺序整数值,而对于该子带或每一个子带,所述方法还包括下列步骤在所述L个数值的序列的M级的情况下,识别出要求的衰减;并把M加在赋给所述子带的该标度系数索引或每一个标度系数索引上,其中1≤M<L,而L和M都是整数。2.对一个或多个压缩数字化声频信号进行混合的方法,其中定义了L个标度系数的第一表,它包括具有L个数值的逐级变化的级数,其第二个和其后的每一个值都由前面的值用共同的函数推算出来,每一个标度系数都唯一地由各个标度系数索引值识别,而所述的信号采取顺序的数字数据帧的形式,而每一帧按共同的安排至少包括以下各段-子带数据值,代表该子带或一个或多个子带中的每一个的多个采样点的值,其中该子带或每一个子带代表各自的频带宽度;以及-标度系数索引值,至少一个被赋值给该子带或所述一个或多个子带之中的每一个,并识别准备在信号解压中用于其上的各个数值标度系数;其特征在于,所述标度系数索引值包括L个顺序整数值,而所述方法还包括将...

【专利技术属性】
技术研发人员:TJ埃弗里特
申请(专利权)人:皇家菲利浦电子有限公司
类型:发明
国别省市:NL[荷兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1