基于多种特征融合的语音篡改检测方法技术

技术编号：23447858 阅读：24 留言：0更新日期：2020-02-28 21:32

本发明专利技术公开了一种基于多种特征融合的语音篡改检测方法，检测语音文件是否为拼接而成，包括以下步骤：步骤S1、将待检测的语音数据进行分帧，划分为多组语音数据帧；步骤S2、对每组语音数据帧提取多维特征；步骤S3、构建基于Attention‑RNN的模型作为分类器；步骤S4、将步骤S2中提取到的多维特征输入训练好的分类器，从而判断当前帧语音是否被篡改。本发明专利技术的方法通过提取帧级特征能够有效挖掘语音信号中前后特征的差异，将多种特征相结合，语音特征挖掘更加丰富，利用注意力机制为同一样本的局部赋予不同的重要性，自动学习出时序信号的特征。

Speech tamper detection method based on multi feature fusion

全部详细技术资料下载

【技术实现步骤摘要】
基于多种特征融合的语音篡改检测方法
本专利技术涉及语音篡改
，具体涉及一种基于多种特征融合的语音篡改检测方法。
技术介绍
数字语音技术的迅速发展，使得其应用范围越来越广泛。但强大的语音编辑软件的出现，破坏了语音的真实性与安全性。在法庭举证、历史文献备份等特殊场景下，要确保数字影像材料的真实性。因此，判定语音篡改与否是司法有关部门亟待解决的问题。二十世纪九十年代以来，数字语音篡改鉴定技术兴起，并迅速发展。Farid于1999年提出了应用双谱分析检测语音信号篡改的办法；Grigoras提出利用ENF(ElectricNetworkFrequency)信息检测语音篡改的检测方法；姚秋明等人提出了基于期望最大化算法的语音重采样篡改的检测方法；Ding等人提出以子带频谱平滑方法检测语音信号是否被插值或拼接篡改，邵松年等人提出利用数字录音设备的本底噪声特性，来检测语音信号中有无被篡改入其他录音设备录制的语音的方法；Yang等人提出基于MP3格式语音帧位移的篡改检测方法。随着机器学习和深度学习技术的发展，研究者们提出了多种有效地机器学习和深度学习识别模型。这些在声音分类问题上取得了巨大的成功。因此，针对语音篡改采用深度学习算法进行识别是未来的研究方向之一。目前针对语音篡改识别的研究相对较少。
技术实现思路
专利技术目的：为了克服现有技术中存在的不足，本专利技术提供一种基于多维特征融合的语音篡改检测方法，其能够有效地识别和区分语音篡改情况，且鲁棒性好。技术方案：为实现上述目的，本专利...

【技术保护点】
1.一种基于多种特征融合的语音篡改检测方法，检测语音文件是否为拼接而成，其特征在于，包括以下步骤：/n步骤S1、将待检测的语音数据进行分帧，划分为多组语音数据帧；/n步骤S2、对每组语音数据帧提取多维特征；/n步骤S3、构建基于Attention-RNN的模型作为分类器；/n步骤S4、将步骤S2中提取到的多维特征输入步骤S3中训练好的分类器中，从而判断当前帧语音是否被篡改。/n

【技术特征摘要】
1.一种基于多种特征融合的语音篡改检测方法，检测语音文件是否为拼接而成，其特征在于，包括以下步骤：
步骤S1、将待检测的语音数据进行分帧，划分为多组语音数据帧；
步骤S2、对每组语音数据帧提取多维特征；
步骤S3、构建基于Attention-RNN的模型作为分类器；
步骤S4、将步骤S2中提取到的多维特征输入步骤S3中训练好的分类器中，从而判断当前帧语音是否被篡改。

2.根据权利要求1所述的基于多种特征融合的语音篡改检测方法，其特征在于：所述步骤S3中，Attention-RNN的模型采用两层RNN层，其中第一层是双向RNN层，然后接入一个注意力层，随后是一个全连接Dense00层和一个用于减轻过拟合的dropout，最后将输入送到一个dense层，并送入softmax分类器，每个输入先传入bi-RNN，根据各自的状态产生中间状态，通过加权得到...

【专利技术属性】
技术研发人员：包永强，梁瑞宇，谢跃，唐闺臣，王青云，朱悦，李明，
申请(专利权)人：南京工程学院，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人