一种基于混沌映射与人耳模型的音频压缩与恢复方法技术

技术编号:38900762 阅读:12 留言:0更新日期:2023-09-22 14:19
本发明专利技术涉及音频压缩技术领域,具体地说,涉及一种基于混沌映射与人耳模型的音频压缩与恢复方法。其包括以下步骤:使用离散傅里叶变换将原始音频信号转换为频域表示、使用混沌映射算法、使用混沌序列对频域表示的音频信号进行加密、根据人耳模型,对加密的频域系数进行丢弃或量化、使用压缩算法对量化后的系数进行编码和压缩、对压缩的音频数据进行解码和解压缩、使用密钥序列重新应用混沌置乱。本发明专利技术在对音频进行压缩的过程中,对人耳所无法听到的高频率的声音进行去除,降低音频压缩后所占用的空间,同时在对音频数据进行压缩的过程中,将音频数据分割为多段并进行编号,再进行数据的压缩,如此来确保数据压缩后的完整性。如此来确保数据压缩后的完整性。如此来确保数据压缩后的完整性。

【技术实现步骤摘要】
一种基于混沌映射与人耳模型的音频压缩与恢复方法


[0001]本专利技术涉及音频压缩
,具体地说,涉及一种基于混沌映射与人耳模型的音频压缩与恢复方法。

技术介绍

[0002]音频在制作出来后,为了使音频得到传输,会将音频压缩储存起来,再进行流通,而音频在制作的过程中,会录入一下高频率的声音,而人耳对不同频率的声音敏感度不同,会使录入的高频率的声音无法被人耳所听到,在对音频进行压缩时,音频的高的也会被压缩,如此人耳无法听到的音频被压缩进入,会增加压缩后文件占用的空间,压缩的音频数据占用的空间大,增加数据存储的空间以及降低传输的速度,同时存在音频在压缩的过程中出现数据缺失的情况,如此便需要一种在进行音频压缩时避免音频出现数据缺失,并在压缩后降低数据占用的空间。

技术实现思路

[0003]本专利技术的目的在于提供一种基于混沌映射与人耳模型的音频压缩与恢复方法,以解决上述
技术介绍
中提出的问题。
[0004]为实现上述目的,本专利技术提供一种基于混沌映射与人耳模型的音频压缩与恢复方法,包括以下步骤:对音频进行压缩:S1、使用离散傅里叶变换将原始音频信号转换为频域表示;S2、使用混沌映射算法,生成一个混沌序列,并将此混沌序列被作为压缩的密钥;S3、使用混沌序列对频域表示的音频信号进行加密;S4、根据人耳模型,对加密的频域系数进行丢弃或量化;S5、使用压缩算法对量化后的系数进行编码和压缩;对音频进行恢复:S6、对压缩的音频数据进行解码和解压缩,还原量化后的频域系数;S7、使用密钥序列重新应用混沌置乱,以还原加密的频域系数;S8、使用反离散傅里叶变换将频域信号转换回时域表示;S9、根据人耳模型的逆过程,对恢复的音频信号进行加权和滤波;S10、获取经过压缩和恢复的音频信号。
[0005]作为本技术方案的进一步改进,所述S1中将原始音频信号转换为频域表示的步骤为:S1.1、将原始音频信号划分为固定长度的片段;S1.2、对每个片段进行DFT计算,得到频域表示数据;S1.3、使用振幅谱(即频谱)和相位谱表示得到的频域表示数据。
[0006]作为本技术方案的进一步改进,所述S2中生成混沌序列的算法采用Logistic映射
算法,其算法公式为:x_{n+1}=r*x_n*(1

x_n)其中,x_n是序列的当前值,r是混沌参数,r取值范围在3.57

4.0之间,x_{n+1}是序列的下一个值;其生成混沌序列的步骤如下:S2.1、初始化:选择初始值x_0(通常在范围(0,1)内选择),选择混沌参数r,并确定序列长度N;S2.2、循环计算:使用Logistic映射算法,迭代计算序列的下一个值x_{n+1}=r*x_n*(1

x_n),重复计算N次;S2.3、数值处理:将生成的混沌序列映射到所需的数值范围;S2.4、序列使用:将生成的混沌序列作为压缩的密钥。
[0007]作为本技术方案的进一步改进,所述S3中使用混沌序列对频域表示的音频信号进行加密的步骤如下:S3.1、将音频信号转换到频域表示;S3.2、生成混沌序列:使用混沌映射算法生成一个与音频信号长度相匹配的混沌序列;S3.3、对混沌序列进行归一化处理,将其映射到[0,2π]或[0,1]的范围内;S3.4、将混沌序列与频域表示的音频信号进行乘法运算;S3.5、将得到的乘积结果进行逆傅里叶变换,将其转换回时域表示。
[0008]作为本技术方案的进一步改进,所述S4中,根据人耳模型对加密的频域系数进行丢弃或量化的具体步骤如下:S4.1、获取人耳对不同频段的敏感度,并根据人耳模型,确定哪些频段的频域系数可以被丢弃或量化;S4.2、对频域系数应用阈值或量化:将频域表示的音频信号的各个频段的系数与阈值或量化步长进行比较;S4.3、根据信号的重要性,调整不同频段的阈值或量化步长;S4.4、对调整后的频域系数进行逆傅里叶变换,将其转换回时域表示。
[0009]作为本技术方案的进一步改进,所述S5使用压缩算法对量化后的系数进行编码和压缩的步骤如下:S5.1、对量化后的系数进行编码:将量化后的系数转换为二进制数据流;S5.2、应用压缩算法进行压缩:使用压缩算法对编码后的系数进行压缩;S5.3、存储或传输压缩后的数据:将压缩后的数据进行存储或传输。
[0010]作为本技术方案的进一步改进,所述S6中,对压缩的音频数据进行解码和解压缩,还原量化后的频域系数的步骤如下:S6.1、根据压缩时选择的压缩算法,选择相应的解压缩算法进行解码和解压缩,将压缩的音频数据进行解压缩;S6.2、进行解码:将解压缩后的数据进行解码,将数据从二进制形式转换为量化后的系数;S6.3、还原量化后的频域系数:使用逆量化算法将解码后的数据还原为量化前的
频域系数;S6.4、进行逆变换:将还原的频域系数进行逆变换。
[0011]作为本技术方案的进一步改进,所述S7中使用密钥序列重新应用混沌置乱还原加密的频域系数的步骤如下:S7.1、生成密钥序列:使用相同的初始条件和控制参数,生成与加密时使用的密钥序列相同的混沌序列;S7.2、重新应用混沌置乱:使用生成的密钥序列,对加密的频域系数进行重新应用混沌置乱;S7.3、进行反量化:使用相同的量化步长和方法进行反量化,还原量化前的系数;S7.4、进行逆变换:将经过混沌置乱和反量化的频域系数进行逆变换。
[0012]作为本技术方案的进一步改进,所述S8中使用反离散傅里叶变换将频域信号转换回时域表示的步骤为:S8.1、准备频域信号:准备已经在频域进行过傅里叶变换的信号;S8.2、通过逆变换还原频域系数:使用反离散傅里叶变换公式,将频域信号的各个频率分量(频域系数)还原回时域表示;S8.3、将复数时域信号转化为实数表示。
[0013]作为本技术方案的进一步改进,所述S9中根据人耳模型的逆过程,对恢复的音频信号进行加权和滤波的步骤如下:S9.1、基于人耳模型的加权:根据人耳对不同频率的声音敏感度不同,将人耳对不同频率的敏感度进行加权;S9.2、基于人耳模型的滤波:根据人耳对声音的感知的一个频率响应特性,对人耳的频率响应特性进行滤波处理;S9.3、重建和处理:经过加权和滤波后,对信号进行动态范围控制处理。
[0014]与现有技术相比,本专利技术的有益效果:1、该基于混沌映射与人耳模型的音频压缩与恢复方法中,在对音频进行压缩的过程中,对人耳所无法听到的高频率的声音进行去除,降低音频压缩后所占用的空间,同时在对音频数据进行压缩的过程中,将音频数据分割为多段并进行编号,再进行数据的压缩,如此来确保数据压缩后的完整性。
附图说明
[0015]图1为本专利技术的整体步骤框图。
具体实施方式
[0016]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于混沌映射与人耳模型的音频压缩与恢复方法,其特征在于:包括以下步骤:对音频进行压缩:S1、使用离散傅里叶变换将原始音频信号转换为频域表示;S2、使用混沌映射算法,生成一个混沌序列,并将此混沌序列被作为压缩的密钥;S3、使用混沌序列对频域表示的音频信号进行加密;S4、根据人耳模型,对加密的频域系数进行丢弃或量化;S5、使用压缩算法对量化后的系数进行编码和压缩;对音频进行恢复:S6、对压缩的音频数据进行解码和解压缩,还原量化后的频域系数;S7、使用密钥序列重新应用混沌置乱,以还原加密的频域系数;S8、使用反离散傅里叶变换将频域信号转换回时域表示;S9、根据人耳模型的逆过程,对恢复的音频信号进行加权和滤波;S10、获取经过压缩和恢复的音频信号。2.根据权利要求1所述的基于混沌映射与人耳模型的音频压缩与恢复方法,其特征在于:所述S1中将原始音频信号转换为频域表示的步骤为:S1.1、将原始音频信号划分为固定长度的片段;S1.2、对每个片段进行DFT计算,得到频域表示数据;S1.3、使用振幅谱(即频谱)和相位谱表示得到的频域表示数据。3.根据权利要求1所述的基于混沌映射与人耳模型的音频压缩与恢复方法,其特征在于:所述S2中生成混沌序列的算法采用Logistic映射算法,其算法公式为:x_{n+1}=r*x_n*(1

x_n)其中,x_n是序列的当前值,r是混沌参数,r取值范围在3.57

4.0之间,x_{n+1}是序列的下一个值;其生成混沌序列的步骤如下:S2.1、初始化:选择初始值x_0(通常在范围(0,1)内选择),选择混沌参数r,并确定序列长度N;S2.2、循环计算:使用Logistic映射算法,迭代计算序列的下一个值x_{n+1}=r*x_n*(1

x_n),重复计算N次;S2.3、数值处理:将生成的混沌序列映射到所需的数值范围;S2.4、序列使用:将生成的混沌序列作为压缩的密钥。4.根据权利要求1所述的基于混沌映射与人耳模型的音频压缩与恢复方法,其特征在于:所述S3中使用混沌序列对频域表示的音频信号进行加密的步骤如下:S3.1、将音频信号转换到频域表示;S3.2、生成混沌序列:使用混沌映射算法生成一个与音频信号长度相匹配的混沌序列;S3.3、对混沌序列进行归一化处理,将其映射到[0,2π]或[0,1]的范围内;S3.4、将混沌序列与频域表示的音频信号进行乘法运算;S3.5、将得到的乘积结果进行逆傅里叶变换,将其转换回时域表示。5.根据权利要求1所述的基于混沌映射与人耳模型的音频压缩与恢复方法,其特征在于:所述S4中,根据人耳模型对加密的频域系数进行丢弃或量化的具体步骤如下:
S4.1、获取人耳对不同频段的敏感度,并根据人耳模...

【专利技术属性】
技术研发人员:区伟洪
申请(专利权)人:建朗电子深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1