一种基于卷积神经网络的数字音频篡改被动检测方法技术

技术编号:26893023 阅读:55 留言:0更新日期:2020-12-29 16:14
本发明专利技术属于数字音频篡改检测技术领域,特别指一种基于卷积神经网络的数字音频篡改被动检测方法。本法发明专利技术提出对ENF波动超矢量特征采用卷积神经网络CNN与注意力机制Attention来进行分类。卷积神经网络可以更好的学习原始音频与篡改音频的差异性。注意力机制从CNN输出的大量特征中筛选出重要信息,减小输入数据的运算负担。本发明专利技术的数字音频篡改检测方法与传统数字音频篡改检测方法相比能够有效提升系统的识别性能,优化了系统结构,提高了相应设备源识别产品的竞争力。

【技术实现步骤摘要】
一种基于卷积神经网络的数字音频篡改被动检测方法
本专利技术属于数字音频篡改检测
,特别指一种基于卷积神经网络的数字音频篡改被动检测方法。
技术介绍
随着数字音频技术的飞速进步,人们能够很方便地采集到数字音频信号,但同时也可利用许多音频处理软件轻易地对其进行后期编辑与修改。若将这种有意或无意篡改的数字音频应用到司法取证等重要场合,将很有可能引发一些不良的社会问题,因此,对数字音频篡改检测的研究有着非常重要的意义。数字音频篡改被动检测是无需添加任何信息,仅靠音频自身特征来对数字音频的真实性和完整性进行分析判别的技术,对于复杂的取证环境具有现实意义。当录音设备采用电网供电时,录制的音频文件中残留有电网频率(ElectircNetworkFrequency,ENF)信号。当数字音频被篡改时这种ENF信号也会随着篡改操作发生变化,于是利用ENF信号的唯一性与稳定性进行音频篡改被动检测有了两种研究思路,第一是将音频中提取出的ENF信号与供电部门的ENF数据库进行对比,这种方法实现难度高,代价大;第二是提取ENF信号中的某些特征,进行一致性与规本文档来自技高网...

【技术保护点】
1.一种基于卷积神经网络的数字音频篡改被动检测方法,其特征在于,一种基于卷积神经网络的数字音频篡改被动检测方法,其特征在于,包括/n步骤1、对原始语音信号进行处理得到电网频率(ENF)成分;/n步骤2、根据步骤1得到的ENF成分,提取基于DFT1的相位谱拟合特征参数P

【技术特征摘要】
1.一种基于卷积神经网络的数字音频篡改被动检测方法,其特征在于,一种基于卷积神经网络的数字音频篡改被动检测方法,其特征在于,包括
步骤1、对原始语音信号进行处理得到电网频率(ENF)成分;
步骤2、根据步骤1得到的ENF成分,提取基于DFT1的相位谱拟合特征参数Pcoe与相位波动特征F1,基于Hilbert变换的频率谱拟合特征参数Fcoe,获得组合特征X=[Fcoe,Pcoe,F1];
步骤3、使用步骤2中的组合特征X训练通用背景模型(UBM),对包含篡改语音和未篡改语音的待训练语音信号按步骤2提取出组合特征X,对UBM模型参数通过自适应MAP来更新模型参数;得到待训练语音的均值矩阵作为ENF高斯均值超矢量;
步骤4、采用卷积神经网络CNN对步骤3中得到的ENF高斯均值超矢量进行训练,使用注意力机制attention对CNN卷积层的输出特征进行特征选择以去除对分类无效的特征,使用sofmax层进行篡改检测。


2.根据权利要求1所述的一种基于卷积神经网络的数字音频篡改被动检测方法,其特征在于,步骤1是对原始语音信号依次进行下采样、窄带滤波得到ENF成分;具体包括:
步骤1.1、下采样:在保证提取ENF精度的同时,有效减少计算量;将信号重采样频率定为1000HZ或者1200HZ;
步骤1.2、窄带滤波:为了防止相位延时得到理想的窄带信号,使用10000阶的线性零相位FIR滤波器进行窄带滤波,中心频率在ENF标准(50HZ或60HZ)处,带宽为0.6HZ,通带波纹0.5dB,阻带衰减为100dB。


3.根据权利要求1所述的一种基于卷积神经网络的数字音频篡改被动检测方法,其特征在于,步骤2中,提取特征的具体方法包括:
步骤2.1、计算ENF信号XENFC[n]在点n处的近似一阶导数
x′ENFC[n]=fd(XENFC[n]-XENFC[n-1])(1)
其中fd(*)表示近似求导操作,XENFC[n]表示ENF成分第n个点的值;
步骤2.2、对x′ENFC[n]进行分帧加窗,帧长为10个标准ENF频率周期帧移为1个标准ENF频率周期用汉宁窗w(n)对x′ENFC[n]进行加窗
x′N[n]=x′ENFC[n]w(n)(2)
其中汉宁窗L为窗长;
步骤2.3、每帧信号x′N[n]与XENFC[n]分别执行N点离散傅里叶变换(DFT)得到X′(k)、X(k),根据|X′(k)|的峰值点的整数索引kpeak估计频率



其中DFT0[kpeak]=X(kpeak),DFT1[kpeak]=F(kpeak)|X′(kpeak)|,F(kpeak)是一个尺度系数;



其中NDFT表示离散傅里叶变换点数,k为峰值点索引;
步骤2.4、计算xENFC的相位
步骤2.5、计算x′ENFC的相位



其中fd为重采样频率,

floor[a]表示小于a的最大整数,ceil[b]表示大于b的最小整数;
步骤2.6、步骤2.5中有两个可能的值,用步骤2.4中作为参考,选择中最接近的值;
步骤2.7、将步骤2.5中得到的x′ENFC的相位代入式(6)得到ENF相位波动特征F



其中表示从nb=2到NBlock的平均值,NBlock表示帧数,

2≤nb≤NBlock,为相应第nb帧的估计相位;
步骤2.8、对信号XENFC[n]进行离散Hilbert变换;首先得到XENFC[n]的解析函数
x(a)ENFC[n]=XENFC[n]+i*H{XENFC[n]}(7)
其中H代表Hilbert变换;瞬时频率f[n]是H{XENFC[n]}相角的变化率;
步骤2.9、对步骤2.8中的f[n]进行低通滤波,去除震荡;使用五阶椭圆滤波器IIR滤波器;中心频率为ENF标准频率,带宽为20HZ,通带波纹为0.5HZ,阻带衰减为64HZ;由于频率估计...

【专利技术属性】
技术研发人员:曾春艳杨尧冯世雄孔帅余琰
申请(专利权)人:湖北工业大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1