基于GMM-BIC的数字音频篡改点检测方法及系统技术方案

技术编号:19483320 阅读:35 留言:0更新日期:2018-11-17 10:57
本发明专利技术属于涉及数字音频信号处理技术领域,公开了一种基于GMM‑BIC的数字音频篡改点检测方法及系统,使用GMM‑BIC方法代替了传统的SGM‑BIC用于数字音频篡改点检测,GMM的特性使得该方法可以表示更多的信息,对较长或者较短的语音段均有较好的表示效果;使用神经网络对拟合特征进行分类,得到更高的分类效果。本发明专利技术实现了数字音频篡改定位的自动化,自适应性好;针对相隔较近的拼接篡改点和使用各种噪声对篡改点进行掩饰的篡改操作,具有很强的鲁棒性;为数字音频篡改点检测的准确性和自动化提出了一种广泛性的算法。

【技术实现步骤摘要】
基于GMM-BIC的数字音频篡改点检测方法及系统
本专利技术属于涉及数字音频信号处理
,尤其涉及一种基于GMM-BIC的数字音频篡改点检测方法及系统。
技术介绍
目前,业内常用的现有技术是这样的:随着计算机及互联网相关技术的发展,人们交换信息的方式快速地从模拟化转向数字化。数字音频数据易于保存、编辑和传播的优点给人们日常生活带来诸多便利和乐趣,大多数人不需要任何专业知识就可以简单快捷地使用音频编辑软件对数字音频文件进行拼接、加入噪声和变换等操作。但是数字化时代给人们带来便捷的同时也带来了隐患,那就是数字信息安全问题。数字音频篡改检测是数字音频取证的一个重要分支,在司法取证、新闻公正和科学发现等领域有着广泛应用,近年来吸引着越来越多的信息安全研究者。其中的一个热点问题就是数字音频篡改点定位,即判断待测语音文件是否由多段语音拼接而成,并准确定位其拼接点的位置。目前专门针对数字音频篡改点定位的研究还不是很多,主要从以下四个方面来切入。基于帧间一致性的定位方法,对语音信号进行分帧操作后,对每帧信号提取某些特征,并对该特征的分布或者走向进行理想预测,根据待测信号每帧信号特征间的一致性判断本文档来自技高网...

【技术保护点】
1.一种基于GMM‑BIC的数字音频篡改点检测方法,其特征在于,所述基于GMM‑BIC的数字音频篡改点检测方法通过分割语音信号中的静音帧,并提取静音帧的MFCC特征;接着按时序再对特征进行长窗分帧,根据GMM‑BIC模型,计算每个长时特征帧的GMM‑BIC值;取所有长时特征帧的GMM‑BIC值所组成的序列中的所有波谷点作为可疑篡改点,并以可疑篡改点为中点,前后分别取2s截断,对每个包含可疑点的截断窗计算GMM‑BIC值序列,使用高斯模型对GMM‑BIC序列进行拟合,对拟合特征进行分类,自动确认篡改点存在的截断窗;对包含篡改点的截断窗,进行迭代计算,自动精确地定位篡改点。

【技术特征摘要】
1.一种基于GMM-BIC的数字音频篡改点检测方法,其特征在于,所述基于GMM-BIC的数字音频篡改点检测方法通过分割语音信号中的静音帧,并提取静音帧的MFCC特征;接着按时序再对特征进行长窗分帧,根据GMM-BIC模型,计算每个长时特征帧的GMM-BIC值;取所有长时特征帧的GMM-BIC值所组成的序列中的所有波谷点作为可疑篡改点,并以可疑篡改点为中点,前后分别取2s截断,对每个包含可疑点的截断窗计算GMM-BIC值序列,使用高斯模型对GMM-BIC序列进行拟合,对拟合特征进行分类,自动确认篡改点存在的截断窗;对包含篡改点的截断窗,进行迭代计算,自动精确地定位篡改点。2.如权利要求1所述的基于GMM-BIC的数字音频篡改点检测方法,其特征在于,所述基于GMM-BIC的数字音频篡改点检测方法具体包括:步骤一:基于篡改语音信号的篡改点位于静音段的假设,通过活动语音检测,留下篡改语音信号的静音帧;步骤二:提取静音帧的MFCC特征,接着按时序对特征序列再进行长时粗分帧,依据GMM-BIC准则计算长时特征帧的GMM-BIC值,初步计算待测信号的可疑篡改点位置;步骤三:将所有长时特征帧的GMM-BIC值所组成的序列中的所有波谷点作为可疑篡改点,并以其为时间节点设置截断窗,增加篡改点附近特征点分辨率;步骤四:对每个包含可疑篡改点的截断窗计算GMM-BIC值序列,使用高斯核对每个序列进行拟合,得到拟合参数作为特征;步骤五:使用深度神经网络DNN对拟合特征构建分类器,自动区分该截断窗内是否包含篡改点,对判断为包含篡改点的截断窗,以对篡改点进行精确定位。3.如权利要求2所述的基于GMM-BIC的数字音频篡改点检测方法,其特征在于,活动语音检测包括:测量语音和噪声之间长期的频谱差异,通过比较长期的频谱包络与平均噪声谱,建立语音/非语音判决规则,产生一个不依赖信号质量的判别决策规则;对信号分帧进行活动语音检测,得到语音活动区域指示指标;步骤二具体包括:步骤A1:根据步骤一得到的语音活动区域指示指标,提取待测信号中的静音帧,并对每帧提取MFCC特征,得到特征序列m[d],d表示帧数;步骤A2:依时间序列对特征序列m[d]按时长进行再分帧,依据GMM-BIC特征选择模型计算每个长时特征帧的GMM-BIC值,所有长时特征帧的GMM-BIC值所组成的序列得到p[m],m表示长时特征帧的个数。4.如权利要求3所述的基于GMM-BIC的数字音频篡改点检测方法,其特征在于,步骤A1中,根据步骤一中得到的语音活动指示指标,分离出待测信号的所有静音帧,按时序提取每一帧的MF...

【专利技术属性】
技术研发人员:王志锋王静左明章叶俊民闵秋莎姚璜夏丹田元陈迪宁国勤
申请(专利权)人:华中师范大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1