当前位置: 首页 > 专利查询>上海大学专利>正文

一种全盲的数字语音认证方法技术

技术编号:3815887 阅读:340 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种全盲的数字语音信号认证方法,其步骤为:(1)对要判别的语音信号分帧处理;(2)将各帧信号分成K段,对各段数据去均值处理;(3)将所得对各帧各段数据做作FFT变换,求其双谱值;(4)以平滑所得各帧数据双谱估计值作双谱等高图;(5)以帧语音信号双谱等高图判断是否存在非线性耦合;(6)判断第一次认定经过篡改的此帧语音信号是否要再次认定其篡改的更精确位置;(7)将需再次认定的经过篡改的帧语音信号再更细分帧,重复上述步骤(2)~(6),认定此帧语音信号更准确篡改位置。该方法能在缺乏数字水印或数字签名的认证消息情况下,有效判定数字语音信号是否经过篡改及其篡改位置的确定,其认证过程不需要在语音信号中预嵌入任何数据。

【技术实现步骤摘要】

本专利技术涉及一种多媒体语音信号安全处理
,具体地说是涉及一种全盲情况下的数字语音认证方法,它是一种利用数字语音信号的双谱特性,在缺乏数字水印或数字签名的认证消息的所谓“全盲”的情况下对数字语音材料进行篡改认证和篡改区域定位的方法。
技术介绍
随着多媒体技术的发展及其成本的不断下降,数字语音材料在很多领域得到广泛的应用,给人们的生活带来了诸多的方便。同时,由于像Adobe Audition等功能日益强大的语音非线性编辑软件的不断出现,也使人们可以轻易地对各种数字语音材料按照自己的意愿进行置换、拼接、删除和插入等再编辑的后期处理,同时又不会引起语音质量的下降,并且完全不留下人耳可感知的痕迹也是有可能的。但是,如果这一技术被利用于非法的目的,则被认为是对数字语音材料进行恶意的篡改,将会给人们的生活和社会带来巨大的负面影响。因此,数字语音认证技术作为一种全新的语音安全技术,其应用覆盖了法庭举证、生活的各个方便都有着重要的实际意义和应用价值。 目前数字音频鉴别技术中最具有代表性的是数字签名、数字水印和新兴的数字多媒体盲取证技术。其中,前两种方法属于主动认证方法,它们具有一个共同的特征要求内容提供方必须对数字语音材料进行预处理,如生成数字签名或嵌入脆弱水印。例如,经过现有技术的文献检索发现,中国专利申请号为200610036498,名称为一种基于Zernike变换的数字音频水印嵌入和认证方法;中国专利授权号20041002735,名称为一种数字音频防篡改方法。此两项专利技术都是一种基于脆弱或半脆弱水印的音频认证方法,是在发送端设定相应的设备嵌入水印,而在接收端通过判断提取水印,认证数字音频材料是否经过了篡改,此类方法对数字音频材料的认证较为有效,且能进行精确的定位。然而,实际生活中的音频材料很少被嵌入水印,导致这类认证方法在实际应用场合有很大局限性。 因此,在不依赖任何签名或嵌入信息的前提下,后一种盲取证的被动认证方法成为一种新颖的数字音频鉴别分析思路,中国专利申请号200810199179,名称为一种MP3音频的篡改盲检测方法。该专利技术是根据MP3的编码原理,对MP3音频格式样本进行压缩,确定所引起的帧偏移量来进行篡改位置估计,仅适用于压缩域MP3格式音频信号的分析,不适用数字语音信号在非压缩域的情况下进行全盲的认证及篡改位置的确定。目前,这类全盲的数字语音取证技术,已成为研究的重点和热点,国内外的很多学者也都对此类盲认证的研究表现出了极大的兴趣。
技术实现思路
本专利技术的目的在于提供一种全盲的数字语音信号认证方法,该方法在缺乏数字水印或数字签名认证的情况下,能判别数字语音信号是否经过篡改及篡改位置的确定。 为了达到上述目的,本专利技术采用下述技术方案 本专利技术的一种全盲的数字语音信号认证方法。利用未经篡改的“自然”的语音信号其过程并不表现为非线性,而被篡改过的语音信号在篡改位置附近将表现为明显的非线性特征,判别语音信号是否经过篡改及其篡改位置的确定,其具体步骤为 (1)、对需要判别的语音信号进行分帧处理对长度为L的、需要判别的语音信号x(n)进行分帧处理,各帧信号包含N个数据; (2)、将各帧信号分成K段,对各段数据去均值处理将各帧中N个数据分成K段,允许相邻数据之间有重叠,各段包含M个数据,对各段数据分别进行去均值处理; (3)、将所得对各帧各段数据做作FFT变换,在频域内求其双谱值对第i段数据{xi(0),xi(1),…,xi(M-1)}作FFT,得到Xi(λ),其中λ=0,1,…,M/2,i=1,…,K;在频域内求其三阶累积量,得到双谱估计 其中,Δ=fs/N0,fs为语音的采样频率,而N0和L1应选择为满足M=(2L1+1)N0的值; (4)、以平滑所得的各帧数据的双谱估计值作出双谱等高图平滑上述所得各段数据的双谱估计,得到 作为此帧语音信号的双谱估计值,并作出双谱等高图; 其中, (5)、以上述帧语音信号的双谱等高图判断是否存在非线性耦合判断语音帧信号是否存在着非线性耦合现象的方法是根据上述帧语音信号的双谱等高图,判断是否存在非线性耦合现象,若不存在非线性耦合,则认定此帧语音信号未经过篡改,则结束认定,若存在非线性耦合,则第一次认定此帧语音信号经过了篡改,转步骤(6); (6)、判断第一次认定经过篡改的此帧语音信号是否需要再次认定其篡改的更精确位置根据测试者的需求判断上述认定的经过篡改的帧语音信号是否需要进一步认定其篡改的更精确位置,若不需要再次认定,则结束认定,如需要再次认定,则转步骤(7); (7)、需要再次认定的经过篡改的帧语音信号进行再更细的分帧,重复上述步骤(2)~(6),认定此帧语音信号更准确的篡改位置若需要进一步的准确定位,根据语音信号的可发声单位为最小单位,进行更细的分帧,重复上述步骤(2)~(6),确定此帧语音信号更准确的篡改位置。 上述步骤(2)中将N个数据分成K段,每段含M个采样点,M为偶数,相邻段数据之间的重叠率为0~50%,在处理过程中可以根据实际情况进行调整。 上述步骤(5)中判断是否存在非线性耦合,其判断是通过已知的双谱等高图中是否在偏于0的频率处存在幅度的增长,若存在,则判为产生了非线性耦合现象,否则,判为不存在非线性耦合现象。 上述步骤(7)中更细的分帧,其分帧以语音可发音单位为最小单位,可减少计算量,且具体的分帧大小可以根据篡改语音帧情况定。 本专利技术的全盲的数字语音认证方法与现有技术相比较,具有显而易见的突出实质性特点和显著的优点该方法能够在缺乏数字水印或数字签名的认证消息的情况下,有效地判定数字语音信号是否经过篡改及其篡改位置的确定,其认证过程不需要在语音信号中预嵌入任何数据,用于数字语音信号最为常见的置换、拼接、插入和删除语音等非线性编辑篡改类型。 附图说明 本专利技术全盲的数字语音认证方法由以下的实施例及附图给出。 图1为使用本专利技术的方法对数字语音进行认证的流程框图; 图2为本专利技术的置换语音篡改认证具体实施例一仿真图; 图3为本专利技术的拼接语音篡改认证具体实施例二仿真图; 图4为本专利技术的插入语音篡改认证具体实施例三仿真图; 图5为本专利技术的删除语音篡改认证具体实施例四仿真图。 具体实施例方式 下面结合附图对本专利技术的全盲的数字语音认证方法实施例作进一步详细说明。 如图1所示,本专利技术的基于双谱分析的全盲的数字语音信号认证方法,利用未经篡改的“自然”的语音信号其过程并不表现为非线性,而被篡改过的语音信号在篡改位置附近将表现为明显的非线性特征,判别语音信号是否经过篡改及其篡改位置的确定,其具体步骤为 (1)、对需要判别的语音信号进行分帧处理; (2)、将各帧信号分成K段,对各段数据去均值处理; (3)、将所得对各帧各段数据做作FFT变换,在频域内求其双谱值; (4)、以平滑所得的各帧数据的双谱估计值作出双谱等高图; (5)、以上述帧语音信号的双谱等高图判断是否存在非线性耦合; (6)、判断第一次认定经过篡改的此帧语音信号是否需要再次认定其篡改的更精确位置; (7)、将步骤(6)需要再次认定的经过篡改的帧语音信号进行再更细的分帧,认定此帧语音信号更准确的本文档来自技高网
...

【技术保护点】
一种全盲的数字语音认证方法,其特征在于该方法具体步骤如下: (1)、对需要判别的语音信号进行分帧处理:对长度为L的、需要判别的语音信号x(n)进行分帧处理,各帧信号包含N个数据; (2)、将各帧信号分成K段,对各段数据去均值处理 :将各帧中N个数据分成K段,允许相邻数据之间有重叠,各段包含M个数据,对各段数据分别进行去均值处理; (3)、将所得对各帧各段数据做作FFT变换,在频域内求其双谱值:对第i段数据{x↑[i](0),x↑[i](1),…,x↑[i](M -1)}作FFT,得到X↑[i](λ),其中λ=0,1,…,M/2,i=1,…,K,在频域内求其三阶累积量,得到双谱估计: *↑[(i)](λ↓[1],λ↓[2])=(1/Δ)**X↑[(i)](λ↓[1]+k↓[1])X↑[(i)] (λ↓[2]+k↓[2])X↑[(i)]*(λ↓[1]+k↓[1]+λ↓[2]+k↓[2]) 其中,Δ=f↓[s]/N↓[0],f↓[s]为语音的采样频率,而N↓[0]和L↓[1]应选择为满足M=(2L↓[1]+1)N↓[0]的值;   (4)、以平滑所得的各帧数据的双谱估计值作出双谱等高图:平滑上述所得各段数据的双谱估计,得到 *(ω↓[1],ω↓[2])=1/K**↑[(i)](ω↓[1],ω↓[2]) 作为此帧语音信号的双谱估计值,并作出双谱等高图,  其中,ω↓[1]=(2πf↓[s]/N↓[0])λ↓[1],ω↓[2]=(2πf↓[s]/N↓[0])λ↓[2] (5)、以上述帧语音信号的双谱等高图判断是否存在非线性耦合:判断语音帧信号是否存在着非线性耦合现象的方法是将上述 帧语音信号的双谱等高图,判断是否存在非线性耦合现象,若不存在非线性耦合,则认定此帧语音信号未经过篡改,则结束认定,若存在非线性耦合,则第一次认定此帧语音信号经过了篡改,转步骤(6); (6)、判断第一次认定经过篡改的此帧语音信号是否需 要再次认定其篡改的更精确位置:根据测试者的需求判断上述认定的经过篡改的帧语音信号是否需要进一步认定其篡改的更精确位置,若不需要再次认定,则结束认定,若需要再次认定,则转步骤(7); (7)、需要再次认定的经过篡改的帧语音信号进行再更细 的分帧,重复上述步骤(2)~(6),认定此帧语音信号更准确的篡改位置:若需要进一步的准确定位,根据语音信号的可发声单位为最小单...

【技术特征摘要】

【专利技术属性】
技术研发人员:宋波方勇王正宁徐斌
申请(专利权)人:上海大学
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1