一种基于伪Zernike矩的语音内容认证方法技术

技术编号:8191475 阅读:172 留言:0更新日期:2013-01-10 02:19
本发明专利技术公开了一种基于伪Zernike矩的语音内容认证方法,水印嵌入时将原始语音信号A分为P帧,每帧分为N段。然后,由每帧前N/2段DCT低频系数的n阶伪Zernike矩幅值的平均值生成水印W,并通过量化每帧的后N/2段DCT低频系数的伪Zernike矩来嵌入水印,得到含水印语音A′。本发明专利技术充分利用了语音信号DCT低频系数的伪Zernike矩幅值与语音内容紧密相关的特性,以及对常规语音信号处理的鲁棒性,既保证了对恶意篡改攻击的敏感性,又保证了良好的容忍一定常规语音信号处理能力。

【技术实现步骤摘要】

本专利技术涉及ー种语音识别,尤其是语音内容真实性和完整性认证问题的解决方法。
技术介绍
近年来,数字化语音通信的迅猛发展和各种语音产品的广泛普及,以及各种功能強大的音频处理软件的出现,使得数字语音的传输与应用日益变得频繁与广泛。与此同吋,篡改传输和存储的语音内容数据变得相对容易。例如,一段重要的法庭证词录音,在存储、传输过程中如果要害部分内容被恶意篡改,其后果可想而知!。因此,如何鉴别一段重要或敏感的语音内容是否被篡改过,哪里被篡改了,语音记录来源是否真实 、可信,这些涉及数字语音真实性的认证问题,引起了国内外学者极大的研究兴趣。音频水印技术作为ー种保护音频的技术手段,从上世纪90年代出现就受到了人们的重视,并成为信息安全研究領域的热点。与音频信号相比,语音信号具有采样率低,对常规信号处理更加敏感等特点。因此,现有的很多音频内容认证算法无法用于语音内容认证,或者用于语音内容认证的效果不是很理想。现实生活中,针对音频更多的是解决版权保护问题,而针对语音则更多的是解决内容真实性和完整性认证问题。基于数字水印的语音内容认证技术,如果嵌入的水印与语音自身内容无关,一方面会増加信息的传输量,另ー方面也存在一定的安全隐患,所以基于语音自身特征或内容来生成水印的语音认证算法就更具有研究意义和实用价值。伪Zernike矩(Zernike矩)的幅值具有旋转不变性的特征,该特征已广泛地应用于图像表不、图像检索和图像水印等领域,而在首频上的应用还很少。文献“Robustaudio watermarking based on low-order Zernike moments,. (Xiang Shi-jun, HuangJi-wu, Yang Rui, 5th International Workshop on Digital Watermarking, pp226-240,Oct. 2006)首先对音频进行ー维到ニ维的变换,然后对相应的ニ维信号进行Zernike变换。通过实验证明了 Zernike矩的幅值对常规信号处理具有很强的鲁棒性;同时分析了Zernike矩的幅值和音频样本值的线性关系,由此提出了基于低阶Zernike矩的鲁棒音频7jC印算法。又献“A pseudo-Zernike moments based audio watermarking scheme robustagainst desynchronization attacks,, (Wang Xiang-yang, Ma Tian-xiao, Niu Pan-pan,Computers and Electrical Engineering, vol.37, no.4, pp. 425-443, July 2011)首先在时域基于统计均值嵌入同步码,然后量化伪Zernike矩的幅值嵌入水印,提出了基于伪Zernike矩的抗同步攻击的音频水印算法。对于上述的基于伪Zernike矩(Zernike矩)的水印算法,一方面,需要计算所有样本点的伪Zernike矩,计算量较大,耗费的时间较长。水印的嵌入是通过同比例地缩放各音频段的样本值来完成的。分析表明,直接缩放音频样本值对原始音频的改变量较大,对原始音频信号的质量造成较大的破坏;另ー方面,水印的嵌入位置和方法是公开的,各音频帧的特征(伪Zernike矩)的计算也是已知的。于是,攻击者可以找到各音频帧的位置并计算每帧的特征,重新量化伪Zernike矩来去除嵌入的水印,使算法失去保护版权的作用。或者,攻击者可以使用其它的音频段来替换含水印的音频,然后量化替换后的音频内容,使其满足水印正确提取的条件,对其内容实施攻击。因此,研究基于内容的抗攻击能力强的语音内容认证算法具有重要的现实意义。
技术实现思路
鉴于现有技术的不足,本专利技术的目的在于提供ー种基于伪Zernike矩的语音内容认证算法,该算法能够有效地区分对语音的常规信号处理操作和恶意攻击,井能有效定位语音内容恶意篡改的位置,从而实现语音内容的真实性和完整性认证。为实现这样的目的,本专利技术以DCT低频系数的伪Zernike矩幅值对常规信号处理的鲁棒性为依据,设计了一种新的水印生成和嵌入方法。 —种基于伪Zernike矩的语音内容认证方法,能够有效区分常规信号处理操作和恶意攻击,同时对恶意攻击能够有效地篡改定位。从而实现语音内容的真实性和完整性认证,包括如下具体步骤(I)水印嵌入首先从语音信号的第K个样本点开始将原始语音信号A分为P帧(K作为水印系统的密钥),并将每帧分为N段。然后计算每帧前N/2段DCT低频系数的η阶伪Zernike矩幅值之和,并求出伪Zernike矩幅值的均值,由均值生成水印W。将得到的水印通过量化DCT低频系数的伪Zernike矩嵌入在每帧的后Ν/2段中,得到的含水印的语音信号记为A'(2)语音内容认证过程与水印嵌入过程类似,首先从待检测语音信号的第Ic1个样本点开始将A*分为P帧,每帧分为N段。计算每帧前N/2段DCT低频系数的η阶伪Zernike矩幅值之和,并求其均值,由均值生成水印W'。计算每帧后Ν/2段DCT低频系数的η阶伪Zernike矩幅值,由Zernike矩的幅值提取出水印W*。比较W*和W',判断那些对应位不同的地方为语音信号被篡改过的位置,从而实现了语音内容真实性和完整性认证。与现有的用于内容认证的语音水印算法相比,本专利技术利用语音的内容来生成水印,接收端在收到语音信号的同时也收到了嵌入在语音信号中的水印。从而減少了传输带宽,节约了资源;同时也增强了水印传送的安全性。水印的嵌入只需要对DCT低频系数进行伪Zernike变换,提高了算法的效率和水印容忍常规信号处理的能力。于是本专利技术更易于实际应用。附图说明图I为本专利技术实施例的含水印语音信号图。图2为对图I部分语音内容静音攻击后的语音信号图。图3为对图I部分内容替换攻击后对应的语音信号图。图4为图2的篡改定位結果。图5为图3的篡改定位結果。图6为不可听性测试结果列表。图7为对常规信号处理的鲁棒性测试结果列表。具体实施例方式以下结合附录和实施例对本专利技术的技术方案作进ー步描述。I、水印的生成和嵌入(I)语音数据的分帧以及每帧语音段的划分。将原始语音信号A= {a(l),I彡I彡LA+K}分为P帧(K作为水印系统的密钥),每帧长为I = LA/P,第i帧记为A⑴(i=I,2,. . .,P)。每帧等分为N段,每段的长为I/N,第i帧第j段记为A (i,j),I彡i彡P,I < j < N。(2)DCT变换。对A(i,j)做DCT变换,D(i,j)表示第i帧第j段的DCT系数,取i帧前N/2段的DCT系数记为D1 (i,j)。(3)计算η阶m重伪Zernike矩。将D1 (i, j)的前Iii1 Xm1个低频系数变换为ニ维信号。按照如下方法计算其η阶m重伪Zernike矩记IV1J为伪Zernike多项式,它是一系列复值多项式构成的集合,IVnJ构成单位圆内的完备正交基,其定义如下式 Vnm (x, y) = Vnm ( P , Θ ) = Rnm ( p ) exp (im Θ )其中η为非负整数,m为满足I m I彡η的整数。记坐标原点到点(x,y)的向量为1,P = I 本文档来自技高网
...

【技术保护点】
一种基于伪Zernike矩的语音内容认证方法,用以区分常规信号处理操作和恶意攻击,同时对恶意攻击能够有效地篡改定位,具体步骤包括:(1)水印嵌入:首先从语音信号的第K个样本点开始将原始语音信号A分为P帧,并将每帧分为N段;然后计算每帧前N/2段离散余弦变DCT低频系数的n阶伪Zernike矩幅值之和,并求出伪Zernike矩幅值的均值,由均值生成水印W;将得到的水印通过量化DCT低频系数的伪Zernike矩嵌入在每帧的后N/2段中,得到含水印语音A′;(2)语音内容认证过程:与水印嵌入过程类似,首先从待检测语音信号A*的第k1个样本点开始将语音分为P帧,每帧分为N段。计算每帧前N/2段DCT低频系数的n阶伪Zernike矩幅值之和,并求其均值,由均值生成水印W′;计算每帧后N/2段DCT低频系数的n阶伪Zernike矩幅值,由Zernike矩的幅值提取出水印W*;比较W*和W′,判断对应位不同的地方为语音信号被篡改过的位置,从而实现了语音内容真实性和完整性认证。

【技术特征摘要】

【专利技术属性】
技术研发人员:王宏霞刘正辉
申请(专利权)人:西南交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利