当前位置: 首页 > 专利查询>梁肇新专利>正文

DAC音频数据压缩与解压缩技术制造技术

技术编号:3046627 阅读:193 留言:0更新日期:2012-04-11 18:40
DAC音频数据压缩与解压缩技术属于高质量音频处理技术领域。它采用多通道独立编码方式采集数据,能够采样8K-1MHz的数据,支持多达32通道的多通道处理方式,解决了现有技术对音频数据采集范围和通道处理方式、数量的限制;将数据进行时域到频域的转换,基于自然的声学模型对频域数据进行人耳敏感度分析,采用指数和尾数编码的方法对数据模糊化处理,提高了音质效果,达到95%以上的CD原声效果;对变换后的数据利用数据位分配表,采用非整数位压缩的方法,提高了数据压缩率;压缩后的模块进行合并,得到DAC文件或DAC音频数据流,然后从DAC文件读入数据帧实现解压缩播放。该技术可以在电脑、影碟机等多媒体设备上应用。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】1.
本技术属于高质量音频处理
,尤其是指能够实现高品质采样压缩和随意多通道压缩与解压缩的技术。2.技术背景决定音频压缩与解压缩质量的技术指标主要有采样频率、采样位数(采样精度)、声道数(通道数)。现有的音频压缩与解压缩技术利用人的心理听觉模型,对声音数据以20hz到44.1khz之间的频率进行采样,采样位数为8位或16位,采样声道从1到8个声道,只能处理单通道(通道就是声道)、两通道、四通道与六通道,且每种通道处理方式都不一致,使其不能处理多语言播放问题,不能随意处理多通道。为了达到数据压缩的目的,现有技术根据人耳对高频声音不敏感的特点,从而把这些不敏感数据丢掉,导致高频数据的丢失,不能对48khz以上的频率数据进行采样,这就直接限制了音质的效果。3.
技术实现思路
为了克服现有音频压缩与解压缩技术采样频率和处理通道受到限制,播放音质较差的问题,提高音频播放品质,本专利技术专利提供了DAC压缩与解压缩技术(DAC是数字音频压缩的英文Digital Audio Compres简称),它支持在8K-1MHZ之间的任意频率中采样压缩、支持多达32通道的多通道处理方式,以相同位率200K-300K(立体声)来作比较,本专利技术专利的音质效果能够达到95%以上的CD原声效果,而现有技术只能达到91%以下的CD原声效果。为解决以上技术问题,本专利技术专利提供的技术方案是在音频数据采集压缩过程中,基于声音的自然模型来编码,在8K-1MHZ之间的任意频率范围内采样,没有频率数据丢失。在把采集后的数据从时域转换到频域时,采用的是指数尾数编码分析方法。指数能确定清晰和模糊的声音,而尾数越大,则声音越精确,此编码保证了高频声音数据能不丢失,同时采用模糊尾数的方法限制了编码后的数据量。本专利技术专利拓宽了压缩频率的范围和灵活性,在8K-1MHZ范围内都可以压缩,不需要指定现在一般使用的频率,如8K,11.25,22.5K,32K,44.1K、96K(DVD);每个通道独立编码,所以可以定义多个通道,能够支持多达32个通道。在音频数据压缩后,进行的解压缩播放过程首先从文件读入一个DAC数据帧,根据数据帧标志分为若干数据组,再把数据组分成数据块。然后,通过查数据分配表来解压缩数据块。解压后,把数据依次进行还原,通过还原得到最终的频域数据。最后进行频域数据到时域的变换,得到了最终播放的音频数据。本专利技术专利的有益效果是(1)能够在8K-1MHZ之间的任意频率进行采样压缩,极大的提高了音质效果,能达到相当于95%以上的CD原声。(2)能支持多达32个通道的声音,可以把多语言压在一起,不需要多个音频流,减少了系统开销。(3)采用非整数位压缩的方法,在不影响音质效果的前提下,极大的提高了数据压缩率。4.附图说明图1说明了本专利技术专利的压缩总体过程。图2说明了本专利技术专利通道数据采集的过程。图3说明将时域数据如何转化为频域数据的过程。图4说明频域数据变换的过程。图5说明数据压缩的具体过程。图6说明将数据块合并为数据帧并保存的过程。图7说明了本技术解压缩的总体过程。图8说明了指数和尾数数据分布情况。图9说明了波形数据段分布情况。5.具体实现方式本专利技术专利中涉及的音频数据采集、压缩、解压缩过程图1中,概要的介绍了如何从一个声音采集设备采集数据到数据变换压缩,直到合并为DAC文件流。首先,采用多通道独立编码方式,进行多通道数据采集。然后,将数据进行时域到频域的转换,得到频域数据。下一步,基于自然声学模型方式分析,采用指数和尾数编码分析方法对数据模糊化处理。继续上述步骤,采用非整数位压缩方法对数据进行压缩。最后,把加工好的数据块合并为数据组,再把若干个数据组合并为一个数据帧,写上同步标记,最后写入DAC文件或DAC数据流。下面,将详细介绍每个处理过程。图2说明了数据采集过程本专利技术专利采用多通道独立编码方式进行多个通道数据采集,最多可采集32个通道数据。所谓多通道独立编码,就是根据用户选择的通道个数,实现通道的数据采集互不相干,而且能够同时进行采集压缩。这样如果声音有多个语种的话,比如国语和粤语,在播放时,通过选择不同的通道播放,就能够清晰的播放不同的语种。(现有技术的数据采集方式只能采集1-8个通道数据且采集方式没有独立区分,这样就不能实现多语种播放。)图2A显示了每个声音通道,图2B显示了每个声音通道采集后的声音数据。图3说明了时域到频域转换过程该过程把数据按规定的长度进行分段(比如512个数据为一段)。由于每个数据段波形数据之间会产生差值,如图9所示,这样播放时会产生噪音。为解决这个问题,在图3A中我们采用了加窗法来消除数据段之间的差值,然后通过图3B中傅立叶变换或MDCT变换把时域数据转换为频域数据。(加窗法就是通过产生一个余玄函数值,然后与每个数据段值相加,从而达到消除差值目的。)图4说明了数据转换过程在得到频域数据后,采用独特的自然声学模型方式对数据进行分析。自然声学模型根据人耳对声音频率的敏感度,分析出人耳敏感度高的频率数据和人耳敏感度低的频率数据。这样做的好处是通过分析,能对不同的敏感度数据分别进行处理,把敏感度高的频率数据进行细化,把敏感度低的频率数据丢弃或压缩。这样既保证了声音的高品质,又有效控制了数据量的大小。通过图4A中我们首先对数据分段,然后在图4B中对分段后的数据进行分析,最后在图4C确认每个数据段的敏感等级并确认数据的尾数位数。通过对数据的分析,把数据按声音敏感分成了区域,根据声音敏感高低来设定每个区域尾数。声音敏感高的区域多取尾数,以便精确的表示数据。声音敏感低的区域少取尾数,这样既不影响声音的质量,又节省了数据空间。数据分析后,我们采取指数尾数编码方法对每个数据区域进行模糊化处理。具体做法为首先在图4D中生成指数数据段。从原始数据段取每一个数据的最高有效位为作为指数,根据这个指数生成一个新的数据。比如数据是13二进制表示为1101,那么它的最高有效数据位为3,生成的指数就是3了。通过遍历整个数据段生成了新的指数数据段。这个段的长度和原始数据段长度一样。然后在图4E中我们根据数据的尾数位数来生成尾数数据。先取原始数据段的最高有效位的下一个有效位的位数,把指数和它相减得到第一个尾数值,如果没有有效位,则尾数值为零。这样生成了第一个尾数数据段。依次类推,做下一次循环取下一个尾数生成下一个尾数数据段。最后图4F合并指数数据和尾数数据,结果数据为指数数据段+尾数数据段1+尾数数据段2+…尾数数据段n,n<32。下面我们举例说明这个过程。比如,有一段数据区为[13,6,8,7,9]二进制表示为[1101,0110,1000,0111,1001]。首先我们取指数,通过计算得到了指数数据段。这里我们取两个尾数,从源数据段次高位开始循环得到第一个尾数数据段,接着取出第二个尾数数据段,最后把数据段合并得到了目标数据段,见图8。图5说明了数据压缩的具体过程在经过数据模糊化处理后,需要对其进行数据压缩,在此采用本专利技术专利特有的非整数位压缩方法。它的优点为用尽可能少的二进制位来存储尽可能多的数据。比如可以用8个二进制位存储5个小于等于2的数,普通方法必须用10个二进制位。这样极大的提高了数据压缩率。具体过程为通过在图5A中对源数据段按一定长本文档来自技高网...

【技术保护点】
DAC音频数据压缩与解压缩技术,支持在8K-1MHZ之间的任意频率中采样压缩、支持多达32通道的多通道处理方式,以相同位率200K-300K(立体声)来作比较,本专利技术专利的音质效果能够达到95%以上的CD原声效果。该技术包括以下步骤:   采用多通道独立编码方式,进行多个通道数据采集;将数据进行时域到频域的转换,得到频域数据;基于自然声学模型方式分析,采用指数和尾数编码的方法对数据模糊化处理;采用非整数位压缩方法对数据进行压缩;压缩后的模块进 行合并,得到DAC文件或DAC音频数据流;从DAC文件读入数据帧进行解压缩播放。

【技术特征摘要】
【国外来华专利技术】1.DAC音频数据压缩与解压缩技术,支持在8K-1MHZ之间的任意频率中采样压缩、支持多达32通道的多通道处理方式,以相同位率200K-300K(立体声)来作比较,本发明专利的音质效果能够达到95%以上的CD原声效果。该技术包括以下步骤采用多通道独立编码方式,进行多个通道数据采集;将数据进行时域到频域的转换,得到频域数据;基于自然声学模型方式分析,采用指数和尾数编码的方法对数据模糊化处理;采用非整数位压缩方法对数据进行压缩;压缩后的模块进行合并,得到DAC文件或DAC音频数据流;从DAC文件读入数据帧进行解压缩播放。2.根据权利要求1的方法,其中“采用多通道独立编码方式,进行多个通道数据采集”的步骤包括步骤多通道音频采集设备按照用户选择的通道个数,各通道之间互不相干地同时进行音频数据采集的步骤;3.根据权利要求1的方法,其中“基于自然声学模型方式分析,采用指数和尾数编码分析方法对数据模糊化处理”的步骤包括步骤基于自然声学模型方式分析;采用指数和尾数编码分析方法对数据模糊化处理。4.根据权利要求3的方法,其中“基于自然声学模型方式分析”的步骤还包括步骤对数据进行分段;对数据段进行分析...

【专利技术属性】
技术研发人员:梁肇新
申请(专利权)人:梁肇新
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利