当前位置: 首页 > 专利查询>天津大学专利>正文

一种结合压缩感知和DWT的音频篡改检测与恢复方法技术

技术编号:27359484 阅读:23 留言:0更新日期:2021-02-19 13:40
本发明专利技术公开了一种结合压缩感知和DWT的音频篡改检测与恢复方法:原始音频分帧;提取每一帧DCT系数;连接每一帧压缩后的系数;线性变换,得到未量化的参照值;计算矩阵A并将浮点型水印信息改为整型,得到要嵌入的水印信息;将水印信息嵌入原始音频的离散小波变换的高频区域;提取水印信息,判断音频信息是否被篡改,定位篡改区域;丢弃篡改区域水印信息,提取未被篡改区域的有效水印信息,得到量化后的参照值的近似值;得到破坏区域压缩后的信息,解压缩,对其进行逆离散小波变换,并连接未破坏区域,得到恢复后的语音信号。本发明专利技术提高了嵌入水印信息的峰值信噪比和篡改恢复后音频的可懂度,计算过程更加的简单,篡改定位更加准确。篡改定位更加准确。篡改定位更加准确。

【技术实现步骤摘要】
一种结合压缩感知和DWT的音频篡改检测与恢复方法


[0001]本专利技术属于多媒体与信号处理领域,尤其是涉及语音信号完整性的认证和保护问题的研究方法,更具体的说,是涉及一种结合压缩感知和DWT的音频篡改检测与恢复方法。

技术介绍

[0002]针对多媒体信号完整性认证和保护问题,有多种采用水印的方法,但这些方法大都是基于图像或者视频的,基于语音的效果并不理想,恢复后的峰值信噪比还有待提高,由于人的听觉感知系统比视觉感知系统更加敏感,需要嵌入水印的信号具有更好的不可感知性,同时,恢复的语音更容易被人理解,针对以上问题,本专利技术提出了一种结合压缩感知和DWT的音频篡改检测与恢复方法。

技术实现思路

[0003]本专利技术的目的是为了克服现有技术中的不足,提出一种结合压缩感知和DWT的音频篡改检测与恢复方法,提高了嵌入水印信息的峰值信噪比和篡改恢复后音频的可懂度,通过计算量化后的参照值来生成水印信息,计算过程更加的简单,篡改定位更加准确。
[0004]本专利技术的目的是通过以下技术方案实现的。
[0005]本专利技术结合压缩感知和DWT的音频篡改检测与恢复方法,包括以下过程:
[0006]步骤一,对原始音频分帧;
[0007]步骤二,提取原始音频每一帧的DCT系数;
[0008]步骤三,连接每一帧压缩后的系数,得到公式(1);
[0009][0010]其中,为原始信号的每帧经压缩后的系数,v为分组重排后连接各帧系数得到的向量;
[0011]步骤四,对公式(1)中的向量做线性变换,根据公式(2)计算得到未量化的参照值;
[0012][0013]其中,r是未被量化的参照值,k是参照值的个数,矩阵A的维数根据随机数种子和分组的个数决定;
[0014]步骤五,根据公式(3)计算矩阵A并根据公式(4)、公式(5)将浮点型水印信息改为整型,得到要嵌入的水印信息;
[0015][0016]其中,A0由随机数种子产生,A(i,j)和A0(i,j)是矩阵A和A0中的元素,每一个压缩后的帧组里包含n
×
m个元素;
[0017][0018]其中,
[0019]f(t)=q/R
max
·
t
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)(4)和(5)中,量化后的整数信息作为水印信息,R
max
是量化后的最大值,为量化后的最大值所对应的函数值,在音频信号中为该位置采样点的系数值,q是量化参数;
[0020]步骤六,根据自适应嵌入算法,将水印信息嵌入原始音频的离散小波变换的高频区域,水印嵌入工作完成,其中,w为水印信息,α为嵌入强度;
[0021]步骤七,根据水印嵌入的逆过程,提取水印信息,对于Speech类型的音频,如果一组内篡改的帧数不影响语义的理解,可判定为未被篡改,因此根据语音的语速和设置的帧的时长设置判定阈值δ,通过与δ作比较来判断语音信息是否被篡改,并定位篡改区域,其他类型的音频,帧组内发生篡改即影响听觉效果,直接定位篡改的区域;定位过程如公式(6)所示;
[0022][0023]其中,p(i,j)表示第j组的第i帧,m为帧的个数,n为组的个数,w

(i,j)为提取的水印,w(i,j)为生成的水印;对于Speech类型的音频,如果第j组中破坏的帧数小于判定阈值δ,则自动进行下一组的判定,如果大于判定阈值δ,则该组被判定为被篡改的组,根据i的值定位篡改区域;其他类型的音频直接根据i和j的值定位篡改区域;
[0024]步骤八,丢弃篡改区域的水印信息,提取未被篡改区域的有效水印信息,根据公式(7)和公式(8)得到量化后的参照值的近似值;
[0025][0026]其中,序列α1,α2,...,α
M
是从未被破坏的帧中提取出的参照值,A
(E)
是删除A中破坏区域的参照值的行之后的矩阵;
[0027][0028]其中,v
R
对应压缩矩阵v中未被破坏的信息,v
T
对应压缩矩阵v中破坏区域的信息;A
(E,R)
和A
(E,T)
分别为A
(E)
对应的v
R
和v
T
中的行;
[0029]步骤九,根据公式(4),嵌入方将量化后的参照值嵌入原始信号,所以提取方提取出的参照值也都是量化以后的结果,而不是序列α1,α2,...,α
M
;而量化后的向量经过处理后,得到序列α1,α2,...,α
M
的近似值,根据公式(9)、(10)、(11)计算得到;
[0030][0031]其中,公式(9)是公式(4)的逆过程;R
max
、f
x
、由(4)和(5)得到;
[0032][0033][0034]其中,计算r

(α1),r

(α2),

,r


M
)得到的向量α'1,α'2,...,α'
M
是经过处理的提取参照值,可近似的认为它是原始未经过量化过的参照值;
[0035]步骤十,根据公式(12)和公式(13)得到破坏区域压缩后的信息,解压缩,对其进行逆离散小波变换,并连接未破坏区域,得到恢复后的语音信号;
[0036][0037]在篡改处的信息近似式写为:
[0038][0039]其中,式(12)和式(13)是一个解压缩的过程,通过式(12)得到S1,S2,

,S
M
,通过式(13)得到压缩量v
T
,解压缩v
T
,得到了恢复后的信号序列,通过逆离散小波变换,并拼接信号序列,最终得到恢复后的信号。
[0040]与现有技术相比,本专利技术的技术方案所带来的有益效果是:
[0041]本专利技术基于压缩感知模型和DWT,提高了嵌入水印信息的峰值信噪比和篡改恢复后音频的可懂度,通过计算量化后的参照值来生成水印信息,计算过程更加的简单,篡改定位更加准确;充分考虑了听觉系统的敏感性和易碎水印的特性,具有更好的实用性。
附图说明
[0042]图1是水印嵌入过程,
[0043]其中,图(a)是整体嵌入过程,图(b)是自适应嵌入过程示意图;
[0044]图2是篡改检测定位与恢复过程;
[0045]图3是水印嵌入前后频谱图举例,
[0046]其中,图(a)是原始音频频谱图,图(b)是含水印的音频频谱图;
[0047]图4是篡改检测与修复举例,其中,
[0048]图(a)是含水印的原始音频频谱图,图(b)是被替换20%的音频频谱图,
[0049]图(c)是恢复后的音频频谱图。
具体实施方式
[0050]下面结合附图对本专利技术作进一步的描本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种结合压缩感知和DWT的音频篡改检测与恢复方法,其特征在于,包括以下过程:步骤一,对原始音频分帧;步骤二,提取原始音频每一帧的DCT系数;步骤三,连接每一帧压缩后的系数,得到公式(1);其中,为原始信号的每帧经压缩后的系数,v为分组重排后连接各帧系数得到的向量;步骤四,对公式(1)中的向量做线性变换,根据公式(2)计算得到未量化的参照值;其中,r是未被量化的参照值,k是参照值的个数,矩阵A的维数根据随机数种子和分组的个数决定;步骤五,根据公式(3)计算矩阵A并根据公式(4)、公式(5)将浮点型水印信息改为整型,得到要嵌入的水印信息;其中,A0由随机数种子产生,A(i,j)和A0(i,j)是矩阵A和A0中的元素,每一个压缩后的帧组里包含n
×
m个元素;其中,f(t)=q/R
max
·
t
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)(4)和(5)中,量化后的整数信息作为水印信息,R
max
是量化后的最大值,为量化后的最大值所对应的函数值,在音频信号中为该位置采样点的系数值,q是量化参数;步骤六,根据自适应嵌入算法,将水印信息嵌入原始音频的离散小波变换的高频区域,水印嵌入工作完成,其中,w为水印信息,α为嵌入强度;步骤七,根据水印嵌入的逆过程,提取水印信息,对于Speech类型的音频,如果一组内篡改的帧数不影响语义的理解,可判定为未被篡改,因此根据语音的语速和设置的帧的时长设置判定阈值δ,通过与δ作比较来判断语音信息是否被篡改,并定位篡改区域,其他类型
的音频,帧组内发生篡改即影响听觉效果,直接定位篡改的区域;定位过程如公式(6)所示;其中,p(i,j)表示第j组的第i帧,m为帧的个数,n为组的个数,w

(i,j)为提取的水印,w(i,j)为生成的水印;对于Speech类型的音频,如果第j组中破坏的帧数小于判定阈值δ,则自动进行下一组的判定,如果大于判定阈值δ,则该组被判定为被篡改的组,根据i的值定位篡改区域;其他类型的音频直接根据i和j的值定位篡改区域;步骤八,丢弃篡改区域的水印信息,提取未被篡改...

【专利技术属性】
技术研发人员:胡洋霞魏建国
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1