一种音频信息自适应隐藏方法技术

技术编号:34767970 阅读:18 留言:0更新日期:2022-08-31 19:23
本发明专利技术提出一种音频信息自适应隐藏方法,包括:步骤1,在发送端,原始音频信号经分帧形成多帧短时信号后,确定信号所属的块类型及其在整个频带的掩蔽阈值;选用窗函数进行加窗处理后再进行时频转换,得到频域信号,结合心理声学模型得出的掩蔽阈值曲线确定频域信号各频点的嵌入强度,嵌入在信号的各频点上,完成信息嵌入,获得含隐蔽信息的音频;步骤2,含隐蔽信息的音频经过信道传输进入接收端;步骤3,在接收端,提取出接收音频中的嵌入信息。所述方法通过在发送端中引入AAC编码器对信号进行分析,对载体信号特性的分析更细致,使得信息的嵌入更适应信号本身特性,对原始音频的修改幅度更小,音质损失更小,具有更好的不可感知性。性。性。

【技术实现步骤摘要】
一种音频信息自适应隐藏方法


[0001]本专利技术涉及隐蔽通信
,具体涉及一种音频信息自适应隐藏方法。

技术介绍

[0002]音频信息隐藏技术,是以音频为载体,利用人类听觉系统的特性,以及音频信号本身存在的冗余,将信息以不可感知的方式隐藏于载体信号中。近年来,音频内容在网络上的传输和发布带来的一系列问题和应用需求,从总体上来说可以分为两大部分:音频数字内容的版权保护问题和特殊场景下的隐蔽通信问题,这两个研究问题都属于音频信息隐藏的研究范畴,利用信息隐藏技术将版权等认证信息嵌入到音频载体中可以实现对数字内容的版权保护,此类应用场景主要强调嵌入的信息不能被人所感知且不影响载体的原有价值,对技术的安全性要求一般较低;隐蔽通信多用于传输秘密信息,将需传输的秘密信息嵌入到音频载体中并发送给接收方,接收方从接收到的信号中提取出秘密信息,这种情况不仅要求嵌入的信息无法感知,还要求算法具有良好的抗干扰和抗攻击能力。传统的加密手段往往依靠密钥的安全性来确保系统的安全性,容易被拦截者破坏,且随着互联网技术的发展和普及,其应用在数字内容管理和保护上的缺陷也逐渐暴露出来。信息隐藏相比传统加密技术多了一层保护,隐藏了信息的存在,进一步提高了信息的安全性,成为了信息安全领域的一个研究热点。
[0003]现有的基于频域的低可感信息嵌入方法,大都是使用逐点嵌入方法,逐点嵌入方法直接将各频点的幅值或功率与其对应临界频带的信掩比SMR相乘,作为各频点的嵌入强度。
[0004]例如,论文A Spread Spectrum Audio Watermarking System with High Perceptual Quality中提出了一种基于扩频理论的音频信息隐藏算法,发送端利用DFT将时域信号转换至频域,根据心理声学模型确定各临界频带的嵌入强度,将扩频后的信息比特嵌入到音频载体中,接收端则利用扩频序列的自相关特性,将接收到的信号与扩频序列进行相关运算解扩从而提取其中的隐蔽信息。
[0005]该现有技术在实际的应用过程中存在如下的技术问题:
[0006]逐点嵌入方法根据各频点的幅值和其对应临界频带的SMR确定嵌入强度,但由于在心理声学模型中SMR是以临界频带为单位计算的,不能完全代表单个频点的最大容许失真,因此该方法虽然满足了各频带内的嵌入能量低于掩蔽阈值的整体要求,但仍有可能出现单个频点的嵌入超过其实际掩蔽阈值进而导致音频质量受损严重的情况;另外,该方法在时频转换时,对时域信号的划分长度固定,那么对平稳信号和瞬时信号具有相同的频域分辨率和时域分辨率,信息嵌入对载体信号的适应性较差,算法的隐蔽性尚有提升空间,此外,由于DFT变换的频谱对称性,实际可供嵌入信息的变换域系数为时域信号长度的一半,在隐藏容量较高时算法的鲁棒性会大大降低。
[0007]基于现有技术存在的如上述问题,本专利技术提供一种音频信息自适应隐藏方法。

技术实现思路

[0008]本专利技术提出一种音频信息自适应隐藏方法。
[0009]本专利技术采用以下技术方案:
[0010]一种音频信息自适应隐藏方法,包括:
[0011]步骤1,在发送端,原始音频信号经分帧形成多帧短时信号后,一路进入心理声学模型,用于确定信号所属的块类型及其在整个频带的掩蔽阈值;另一路进入滤波器模块,根据心理声学模型确定的块类型选用窗函数进行加窗处理后再进行时频转换,得到频域信号,其中,要嵌入的信息分为隐蔽信息和同步信息,隐蔽信息是真正要嵌入的信息,经过编码后转换为二进制表示,同步信息则用于接收端的同步,将信息比特扩频为一组扩频码字,结合心理声学模型得出的掩蔽阈值曲线确定频域信号各频点的嵌入强度,嵌入在信号的各频点上,得到嵌入信息后的频域信号,通过滤波器模块反变换回时域音频信号,完成信息嵌入,获得含隐蔽信息的音频;
[0012]步骤2,含隐蔽信息的音频经过信道传输进入接收端;
[0013]步骤3,在接收端,将含隐蔽信息的音频进行分帧形成多帧短时信号,一路进入心理声学模型,用于确定信号所属的块类型;另一路进入滤波器模块,根据心理声学模型确定的块类型选用窗函数进行加窗处理后再进行时频转换,得到已嵌入信息的频域信号,将其与和发送端相同的扩频序列p做相关运算进行解扩,将解扩得到的隐蔽信息比特采用与发送端编码对应的译码手段进行译码即能够提取出接收音频中的嵌入信息。
[0014]进一步地,步骤1中,利用扩频序列p将需要嵌入的信息比特“1”映射为p,
“‑
1”映射为

p。
[0015]进一步地,步骤1中,利用AAC音频编码中的心理声学模型模块实现对音频载体信号特性的分析,根据信号本身特性将其划分为长块和短块,将每帧音频信号按照采样率和长块和短块类型划分为对应的多个比例因子频带;根据频域掩蔽特性计算该帧信号在各比例因子频带内的最小掩蔽比,作为隐蔽信息嵌入的依据。
[0016]进一步地,步骤1中,滤波器模块为AAC音频编码的时频变换处理模块,采用改进离散余弦变换MDCT,改进离散余弦变换MDCT使用了时域混叠消除TDAC技术,其中,改进离散余弦变换MDCT及反向修正离散余弦变换IMDCT计算公式如下:
[0017][0018][0019]上式1

2中,x(n)是原始信号,X(k)是MDCT频值,N是变换点数,n,k分别为时域、频域信号索引。
[0020]进一步地,信号在各个频点的嵌入强度的确定通过借鉴AAC音频编码中非均匀量化原理实现,包括:
[0021]步骤1.11,根据信号频值及心理声学模型计算得出的当前比例因子频带内的掩蔽比计算当前比例因子频带内的最大允许量化噪声:
[0022][0023][0024]上式3

4中,sfb代表比例因子频带索引,low(sfb)、high(sfb)分别为sfb内的谱线始末索引,Enrg
sfb
是比例因子频带sfb内的总能量,maxNoise
sfb
是比例因子频带sfb内的最大允许量化噪声,X(k)是索引k处的MDCT频值,SMR
sfb
是比例因子频带sfb内的掩蔽比;
[0025]步骤1.12,初始化量化步长,保证当前量化噪声小于最大允许失真;
[0026]步骤1.13,对当前比例因子频带内的各频点进行非均匀量化,量化公式为:
[0027][0028]上式5中,X(k)是信号频值,sgn(
·
)为符号函数,+1表示非负数,

1表示负数,int(
·
)是四舍五入的函数,stepsize是量化步长,X
quant
(k)是量化后的值;
[0029]步骤1.14,根据各频点的量化值进行反量化:
[0030][0031]步骤1.15,计算比例因子频带内的量化噪声;
[0032]步骤1.16,若当前量化噪声小于最大允许量化噪声,保存当前量化步长,再继续增大本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频信息自适应隐藏方法,其特征在于,包括:步骤1,在发送端,原始音频信号经分帧形成多帧短时信号后,一路进入心理声学模型,用于确定信号所属的块类型及其在整个频带的掩蔽阈值;另一路进入滤波器模块,根据心理声学模型确定的块类型选用窗函数进行加窗处理后再进行时频转换,得到频域信号,其中,要嵌入的信息分为隐蔽信息和同步信息,隐蔽信息是真正要嵌入的信息,经过编码后转换为二进制表示,同步信息则用于接收端的同步,将信息比特扩频为一组扩频码字,结合心理声学模型得出的掩蔽阈值曲线确定频域信号各频点的嵌入强度,嵌入在信号的各频点上,得到嵌入信息后的频域信号,通过滤波器模块反变换回时域音频信号,完成信息嵌入,获得含隐蔽信息的音频;步骤2,含隐蔽信息的音频经过信道传输进入接收端;步骤3,在接收端,将含隐蔽信息的音频进行分帧形成多帧短时信号,一路进入心理声学模型,用于确定信号所属的块类型;另一路进入滤波器模块,根据心理声学模型确定的块类型选用窗函数进行加窗处理后再进行时频转换,得到已嵌入信息的频域信号,将其与和发送端相同的扩频序列p做相关运算进行解扩,将解扩得到的隐蔽信息比特采用与发送端编码对应的译码手段进行译码即能够提取出接收音频中的嵌入信息。2.根据权利要求1所述的音频信息自适应隐藏方法,其特征在于,步骤1中,利用扩频序列p将需要嵌入的信息比特“1”映射为p,
“‑
1”映射为

p。3.根据权利要求1所述的音频信息自适应隐藏方法,其特征在于,步骤1中,心理声学模型模块实现对音频载体信号特性的分析,根据信号本身特性将其划分为长块和短块,将每帧音频信号按照采样率和长块和短块类型划分为对应的多个比例因子频带;根据频域掩蔽特性计算该帧信号在各比例因子频带内的最小掩蔽比,作为隐蔽信息嵌入的依据。4.根据权利要求1所述的音频信息自适应隐藏方法,其特征在于,步骤1中,滤波器模块采用改进离散余弦变换MDCT,改进离散余弦变换MDCT使用了时域混叠消除TDAC技术,其中,改进离散余弦变换MDCT及反向修正离散余弦变换IMDCT计算公式如下:改进离散余弦变换MDCT及反向修正离散余弦变换IMDCT计算公式如下:上式1

2中,x(n)是原始信号,X(k)是MDCT频值,N是变换点数,n,k分别为时域、频域信号索引。5.根据权利要求1所述的音频信息自适应隐藏方法,其特征在于,确定信号在各个频点的嵌入强度包括:步骤1.11,根据信号频值及心理声学模型计算得出的当前比例因子频带内的掩蔽比计算当前比例因子频带内的最大允许量化噪声:算当前比例因子频带内的最大允许量化噪声:
上式3

4中,sfb代表比例因子频带索引,low(sfb)、high(sfb)分别为sfb内的谱线始末索引,Enrg
sfb
是比例因子频带sfb内的总能量,maxNoise
sfb
是比例因子频带sfb内的最大允许量化噪声,X(k)是索引k...

【专利技术属性】
技术研发人员:彭涛王梦宇王文博
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1