一种基于系数自相关度的语音内容取证方法技术

技术编号:19554032 阅读:40 留言:0更新日期:2018-11-24 22:28
本发明专利技术涉及语音信号处理技术领域,公开了一种基于系数自相关度的语音内容取证方法,包括:原始语音信号预处理,将原始语音信号分为P帧,第i帧记为Ai,将Ai分为M段;系数自相关度特征提取,由DCT系数计算Ai,m的系数自相关度特征;由帧号二值化生成水印;水印嵌入,对量化之后的系数C′i,m进行逆DCT,将水印wm嵌入在Ai,m中;水印提取和篡改定位;若检测到被攻击的语音帧,检测紧接着的连续N个样本,直到找到能通过验证的连续N个样本,然后重构前一个和当前通过验证的帧号,两帧号之差即为被定为的篡改内容,这种基于系数自相关度的语音内容取证方法,需要嵌入的容量较小;能够对篡改内容进行精确地篡改定位的同时,提高了水印系统的安全性和水印的不可听性。

A Speech Content Forensics Method Based on Coefficient Autocorrelation

The invention relates to the field of speech signal processing technology, and discloses a method of speech content forensics based on coefficient autocorrelation, which includes: original speech signal preprocessing, dividing the original speech signal into P frames, recording Ai as the first frame, dividing Ai into M segments, extracting features of coefficient autocorrelation, calculating coefficient autocorrelation of Ai and m from DCT coefficients. Degree feature; Watermarking is generated by binarization of frame number; Watermarking is embedded. The quantized coefficients C'i and m are inversely DCT, and the watermarking WM is embedded in Ai and m; Watermarking is extracted and tampered with; If an attacked voice frame is detected, the following consecutive N samples are detected until the validated consecutive N samples are found and then re-located. The difference between the two frame numbers before and after verification is defined as tampered content. This method of speech content forensics based on coefficient autocorrelation requires less embedded capacity. It can locate tampered content accurately and improve the security of watermarking system and the inaudibility of watermarking. Sex.

【技术实现步骤摘要】
一种基于系数自相关度的语音内容取证方法
本专利技术涉及语音信号处理
,特别涉及一种基于系数自相关度的语音内容取证方法。
技术介绍
数字语音信号作为重要的信息传播载体,在我们生活中发挥着越来越重要的作用。由于数字信号处理技术的发展和编辑攻击的丰富,对数字语音信号的编辑和伪造变得简单易行。伪造的数字语音信号表示的内容和原始信号相比,有着较大的区别,或者表示的意义完全不同。若伪造的语音信号的内容被用户接受,将会带来严重的后果。同时,大量存在的伪造的语音信号,已经影响了数字语音信号所表示内容的认可度。对数字语音的内容取证技术能够鉴别语音内容的真实性,而对该技术的研究也具有研究意义和实用价值。文献“Centroid-basedSemi-fragileAudioWatermarkinginHybridDomain”(H.X.Wang,M.Q.Fan,ScienceinChinaSeriesF-InformationSciences,vol.53,no.3,PP.619-633,2010)”提出了一种基于质心的语音内容取证方法。由语音信号的质心这样的特征生成水印,并将水印嵌入在基于DWT和DCT的混合域中。该方法中,生成水印的特征和嵌入水印的特征均是公开的。攻击者可以选择任意的一段语音信号,采用同样的方法,将水印嵌入在该段信号中,然后替换含水印的语音信号。验证端将检测不到替换的内容。于是,该方法存在较大的安全隐患。文献“Apseudo-Zernikemomentsbasedaudiowatermarkingschemerobustagainstdesynchronizationattacks”(WangXiang-yang,MaTian-xiao,NiuPan-pan,ComputersandElectricalEngineering,2011,37:425-443)首先在时域基于统计均值嵌入同步码,然后量化伪Zernike矩的幅值嵌入水印,提出了基于伪Zernike矩的抗同步攻击的音频水印算法。该方法中,嵌入同步码和水印的特征均是公开的,攻击者可以使用其它的音频段来替换含水印的音频,然后量化替换后的音频内容,使其满足水印正确提取的条件,对其内容实施攻击,且攻击的内容会被认为是真实的。由专利申请提出者提出的中国专利技术专利申请号201610304912.7的《一种基于DWT和DCT的数字语音取证和篡改恢复方法》对音频内容取证技术做出了一定的努力。虽然该方法基于分块思想的整数嵌入方法,但因需要的嵌入容量太大,势必造成对载体信号较大的改变,引起不可听性的降低。本专利技术以内容取证和篡改定位为目的,仅仅嵌入用于篡改定位的水印信息,需要嵌入容量较小。从取证的角度来看,本专利技术能够对篡改内容进行精确地篡改定位的同时,提高了水印系统的安全性和水印的不可听性,弥补了先前专利(中国专利申请号201610304912.7)因需要嵌入容量大而降低不可听性的不足。是取证方法的一个改进。
技术实现思路
本专利技术提供一种基于系数自相关度的语音内容取证方法,可以解决现有技术中的上述问题。本专利技术提供了一种基于系数自相关度的语音内容取证方法,包括以下步骤:S1、原始语音信号预处理将原始语音信号A分为长度为N且相互不重叠的P帧,第i帧记为Ai,其中,1≤i≤P;将Ai分为M段,Mmod2=0,第m段记为Ai,m,其中,1≤m≤M,每段的长为N1,N1=LA/(N×M),其中LA为原始语音信号A的长度;S2、系数自相关度特征提取对Ai,m进行离散余弦变换(DiscreteCosineTransform,简称DCT),得到DCT系数记为Ci,m={c(1),c(2),…,c(N1)};根据公式(1)由Ci,m计算Ai,m的系数自相关度特征Di,m,公式(1)中Di,m为Ai,m的系数自相关度特征,α和为β系统密钥,c(l)表示Ci,m中的第l个系数;h表示移位,当l+h>N1时,c(l+h)=c(l+h-N1);S3、生成水印Wi={w1,w2,…,wM}记为要嵌入在第i帧中的水印,Wi由W1i和W2i两部分组成,其中W1i和W2i均由第i帧的帧号二值化生成,即Wi=[W1i,W2i];S4、水印嵌入假设wm为嵌入在Ai,m中水印,通过量化系数自相关度特征Di,m来嵌入wm,量化方法如公式(2):公式(2)中D′i,m为量化之后的系数自相关度特征,Δ为量化步长;由公式(3)量化Ai,m的DCT系数,量化之后的系数记为C′i,m,对量化之后的系数C′i,m进行逆DCT,即可将水印wm嵌入在Ai,m中,重复上述步骤,即可完成各帧水印的嵌入,记含水印信号为A′;S5、水印提取和篡改定位首先,将含水印信号A′分为长度为N的帧,第i帧记为A′i,然后,将A′i等分为M段,第m段记为A′i,m,1≤m≤M,对A′i,m进行DCT,根据得到的DCT系数计算A′i,m的系数自相关度特征WDi,m,提取水印w′m,1≤m≤M;如果则A′i,m是真实的;如果则表明A′i,m是被攻击的;若检测到被攻击的语音帧,检测紧接着的连续N个样本,直到找到能通过验证的连续N个样本,然后重构前一个和当前通过验证的帧号,两帧号之差即为定位到的被攻击的内容。与现有技术相比,本专利技术的有益效果在于:本专利技术以内容取证和篡改定位为目的,仅仅嵌入用于篡改定位的水印信息,需要嵌入的容量较小;从取证的角度来看,本专利技术能够对篡改内容进行精确地篡改定位的同时,提高了水印系统的安全性和水印的不可听性。附图说明图1为本专利技术载体信号的分帧方法。图2为水印嵌入过程框图。图3为水印提取和内容取证过程框图。图4为篡改定位方法。图5为β不同取值时对应的自相关度特征。图6为本专利技术选取的含水印音频信号。图7为删除攻击后的含水印音频信号。图8为替换攻击后的含水印音频信号。图9为删除攻击后的篡改定位结果。图10为替换攻击后的篡改定位结果。具体实施方式下面结合附图,对本专利技术的一个具体实施方式进行详细描述,但应当理解本专利技术的保护范围并不受具体实施方式的限制。1、载体信号预处理:(1)将载体信号A分为长度为N且相互不重叠的P帧,第i帧记为Ai;(2)将Ai分为M段,Mmod2=0,第m段记为Ai,m,每段的长为N1,N1=LA/N×M,1≤m≤M。载体信号分帧方法如图1所示。2、特征提取:(1)对Ai,m进行DCT,得到的系数记为Ci,m={c(1),c(2),…,c(N1)}。(2)由下式计算Ai,m的系数自相关度特征:其中Di,m为Ai,m的系数自相关度,α和β为系统密钥,c(l)表示Ci,m中的第l个系数;h表示移位。当l+h>N1时,c(l+h)=c(l+h-N1)。3、水印嵌入记Wi={w1,w2,…,wM}为要嵌入在第i帧中的水印。Wi由W1i和W2i两部分组成,其中W1i和W2i均由第i帧的帧号二值化生成,即Wi=[W1i,W2i]。假设wm为嵌入在Ai,m中水印。(1)通过量化系数自相关度来嵌入wm,量化方法如下式:其中D′i,m为量化之后的系数自相关度,Δ为量化步长。(2)由下式量化Ai,m的DCT系数,量化之后的系数记为C′i,m,(3)对量化之后的系数C′i,m进行逆DCT,即可将水印wm嵌入在Ai,m中。重复上述本文档来自技高网
...

【技术保护点】
1.一种基于系数自相关度的语音内容取证方法,其特征在于,包括以下步骤:S1、原始语音信号预处理将原始语音信号A分为长度为N且相互不重叠的P帧,第i帧记为Ai,其中,1≤i≤P;将Ai分为M段,M mod 2=0,第m段记为Ai,m,其中,1≤m≤M,每段的长为N1,N1=LA/(N×M),其中,LA为原始语音信号A的长度;S2、系数自相关度特征提取对Ai,m进行DCT,得到DCT系数记为Ci,m={c(1),c(2),…,c(N1)};根据公式(1)由Ci,m计算Ai,m的系数自相关度特征Di,m,

【技术特征摘要】
1.一种基于系数自相关度的语音内容取证方法,其特征在于,包括以下步骤:S1、原始语音信号预处理将原始语音信号A分为长度为N且相互不重叠的P帧,第i帧记为Ai,其中,1≤i≤P;将Ai分为M段,Mmod2=0,第m段记为Ai,m,其中,1≤m≤M,每段的长为N1,N1=LA/(N×M),其中,LA为原始语音信号A的长度;S2、系数自相关度特征提取对Ai,m进行DCT,得到DCT系数记为Ci,m={c(1),c(2),…,c(N1)};根据公式(1)由Ci,m计算Ai,m的系数自相关度特征Di,m,公式(1)中Di,m为Ai,m的系数自相关度特征,α和β为系统密钥,c(l)表示Ci,m中的第l个系数;h表示移位,当l+h>N1时,c(l+h)=c(l+h-N1);S3、生成水印Wi={w1,w2,…,wM}记为要嵌入在第i帧中的水印,Wi由W1i和W2i两部分组成,其中W1i和W2i均由第i帧的帧号二值化生成,即Wi=[W1i,W2i];S4、水印嵌入假设wm...

【专利技术属性】
技术研发人员:李艳丽孙芳何俊杰刘正辉
申请(专利权)人:信阳师范学院
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1