一种利用字节帧间幅度谱相关性的音频同源篡改检测方法技术

技术编号：18897339 阅读：125 留言：0更新日期：2018-09-08 12:21

本发明专利技术公开了一种利用字节帧间幅度谱相关性的音频同源篡改检测方法，包括音频预加重、分帧加窗、计算各帧过零率，分离字节，剔除短字节，计算两字节间各帧的幅度谱相似度，判断字节复制粘贴关系及篡改定位。发明专利技术方法检测准确率高、定位精度较高且计算复杂度小。

An audio homology tampering detection method based on correlation between byte frames and amplitude spectrum

The invention discloses an audio homology tampering detection method utilizing the correlation of amplitude spectrum between bytes, which includes audio pre-emphasis, sub-frame windowing, calculating the zero-crossing rate of each frame, separating bytes, eliminating short bytes, calculating the amplitude spectrum similarity of each frame between two bytes, judging the byte copy-paste relationship and tamper location. The inventive method has high detection accuracy, high positioning accuracy and small computational complexity.

全部详细技术资料下载

【技术实现步骤摘要】
一种利用字节帧间幅度谱相关性的音频同源篡改检测方法
本专利技术涉及音频取证
，具体涉及一种利用字节帧间幅度谱相关性的音频同源篡改检测方法。
技术介绍
随着多媒体技术的普遍使用和日趋成熟，人们更容易获取信息，随之产生了如何检验多媒体信息是否完整、可靠的问题。如何对多媒体数据进行有效的篡改检测已成为信息安全领域的一个重要研究课题。相较于图像和视频，针对数字音频的篡改检测研究较少。对于音频篡改，同源复制粘贴篡改是最容易实现的也是最常见的。篡改者将音频中的某个片段进行复制并粘贴到该音频的其他位置，从而改变音频的真实语义。如果不法分子将扭曲的篡改音频用于法庭证据、部门机密信息等方面，则会造成严重的后果。因为同源复制粘贴篡改只在同段音频中操作，使得这类篡改具有隐蔽性高且容易实现的特点。因此，研究音频同源复制粘贴篡改的检测方法对于保证数字多媒体信息的原始性、真实性和完整性具有非常重要的意义。
技术实现思路
为了克服现有技术存在的缺点与不足，本专利技术提供一种利用字节帧间幅度谱相关性的音频同源篡改检测方法。本专利技术采用如下技术方案；一种利用字节帧间幅度谱相关性的音频同源篡改检测方法，包括如下步骤：S1将待测音频信号预加重；S2对预加重后的音频进行加窗分帧处理，其中帧时长为m，帧移为n，分帧加窗后的时域音频信号表示为yl，其中帧序号l＝1,2,…,Nframe，Nframe为音频帧数量；S3对加窗分帧后的各帧音频信号计算过零率zcr(l)；S4根据低频频谱能量分离待测音频中的各个字节；S5剔除无效字节，具体为：设定最短字节时长阈值tm，将时长小于tm的字节剔除，得到有效...

【技术保护点】
1.一种利用字节帧间幅度谱相关性的音频同源篡改检测方法，其特征在于，包括如下步骤：S1将待测音频信号预加重；S2对预加重后的音频进行加窗分帧处理，其中帧时长为m，帧移为n，分帧加窗后的时域音频信号表示为yl，其中帧序号l＝1,2,…,Nframe，Nframe为音频帧数量；S3对加窗分帧后的各帧音频信号计算过零率zcr(l)；S4根据低频频谱能量分离待测音频中的各个字节；S5剔除无效字节，具体为：设定最短字节时长阈值tm，将时长小于tm的字节剔除，得到有效字节集合X＝{x1,x2,x3,…,xM}，其中xi为第i个字节，M为有效字节的个数；S6计算剔除无效字节后的待测音频信号中的两字节间各帧的幅度谱相似度；S7设定相似度阈值Th，若两个字节中存在两对或两对以上的帧幅度谱相似度大于给定阈值，则判断字节xi和xj存在复制粘贴关系；S8对所有的字节i≠j∈{1,2,...,M}，重复S6和S7，得到所有存在复制粘贴关系的字节对，由此可定位出待测音频中的复制粘贴区域。

【技术特征摘要】
1.一种利用字节帧间幅度谱相关性的音频同源篡改检测方法，其特征在于，包括如下步骤：S1将待测音频信号预加重；S2对预加重后的音频进行加窗分帧处理，其中帧时长为m，帧移为n，分帧加窗后的时域音频信号表示为yl，其中帧序号l＝1,2,…,Nframe，Nframe为音频帧数量；S3对加窗分帧后的各帧音频信号计算过零率zcr(l)；S4根据低频频谱能量分离待测音频中的各个字节；S5剔除无效字节，具体为：设定最短字节时长阈值tm，将时长小于tm的字节剔除，得到有效字节集合X＝{x1,x2,x3,…,xM}，其中xi为第i个字节，M为有效字节的个数；S6计算剔除无效字节后的待测音频信号中的两字节间各帧的幅度谱相似度；S7设定相似度阈值Th，若两个字节中存在两对或两对以上的帧幅度谱相似度大于给定阈值，则判断字节xi和xj存在复制粘贴关系；S8对所有的字节i≠j∈{1,2,...,M}，重复S6和S7，得到所有存在复制粘贴关系的字节对，由此可定位出待测音频中的复制粘贴区域。2.根据权利要求1所述的音频同源篡改检测方法，其特征在于，所述过零率的计算公式为：其中，yl(k)表示第l帧的第k个数据点，K为各帧的数据点数，sgn[]是符号函数，如下式：3.根据权利要求1所述的音频同源篡改检测方法，其特征在于，所述S4中根据低频频谱能量分...

【专利技术属性】
技术研发人员：胡永健，余颖娟，刘琲贝，贺前华，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人