【技术实现步骤摘要】
一种基于深度学习的平滑语音检测方法、装置及智能设备
本专利技术涉及多媒体信息安全与取证
,尤其涉及的是一种基于深度学习的平滑语音检测方法、装置、智能设备及存储介质。
技术介绍
近年来,随着智能手机的普及,人们能够通过手机方便地获取数字语音信号等多媒体信息。而随着数字语音信号处理技术的不断发展,CoolEditPro等音频编辑软件的功能也日趋完善。通过音频编辑软件,人们除了能够更专业地分析音频信号以外,还能够轻易地对语音信号进行剪切等篡改操作,并且让人难以察觉。这些被恶意伪造、篡改的语音信号很有可能会作为虚假信息散布在社会上引导大众舆论,甚至有可能会被人用作法庭举证来颠倒事实真相,这样会在一定程度上对个人以及社会带来威胁。因此,通过音频取证技术对手机录音进行篡改检测,能够用于判定手机录音的原始性和真实性,从而能够在一定程度上保障个人利益、维护社会稳定。在语音篡改操作中,最直接的篡改方式是删除语音信号中的语音片段,从而达到改变语义的效果。当使用音频编辑软件对语音信号进行剪切时,软件会根据剪切处两端样本点的协调程度,自动地对 ...
【技术保护点】
1.一种基于深度学习的平滑语音检测方法,其特征在于,所述方法包括:/n对接收到的语音信号解压缩,保持原有的采样率,并对所述语音信号进行离散余弦变换,得到语音信号的离散余弦变换系数;/n设置基于一维卷积的平滑语音检测网络,所述平滑语音检测网络包括一维卷积层、归一化层、池化层以及全连接层;/n将得到的语音信号的离散余弦变换系数、输入平滑语音检测网络进行训练,得到具有识别平滑语音能力的网络模型;/n使用训练好的具有识别平滑语音能力的网络模型,对待测的语音进行平滑检测,输出分类结果。/n
【技术特征摘要】
1.一种基于深度学习的平滑语音检测方法,其特征在于,所述方法包括:
对接收到的语音信号解压缩,保持原有的采样率,并对所述语音信号进行离散余弦变换,得到语音信号的离散余弦变换系数;
设置基于一维卷积的平滑语音检测网络,所述平滑语音检测网络包括一维卷积层、归一化层、池化层以及全连接层;
将得到的语音信号的离散余弦变换系数、输入平滑语音检测网络进行训练,得到具有识别平滑语音能力的网络模型;
使用训练好的具有识别平滑语音能力的网络模型,对待测的语音进行平滑检测,输出分类结果。
2.根据权利要求1所述的基于深度学习的平滑语音检测方法,其特征在于,所述对接收到的语音信号解压缩,保持原有的采样率,并对所述语音信号进行离散余弦变换,得到语音信号的离散余弦变换系数的步骤包括:
对接收到的语音信号进行解压缩,以原有的采样率以及位深将语音信号解压为单通道波形信号;
对波形信号进行离散余弦变换,得到语音信号的离散余弦变换系数:
其中,n表示语音时域信号中的样本点,k表示离散余弦变换系数的样本点。
3.根据权利要求1所述的基于深度学习的平滑语音检测方法,其特征在于,所述设置基于一维卷积的平滑语音检测网络,所述平滑语音检测网络包括一维卷积层、归一化层、池化层以及全连接层的步骤包括:
设置能捕捉一维平滑信号差异的网络结构;采用5层卷积核为1x3的一维卷积层加2层全连接层的形式、进行特征提取分类;
在每层卷积层配备一个批量归一化层;
在第一、第二和第四个批量归一化层后面,使用采样核为1x3,步长为2的最大池化层来进行采样;
在第五个批量归一化层后面,使用全局平均池化层来进行降维;
全局平均池化层后面接两个节点数分别为512和2的全连接层进行分类,其中第一个全连接层后接一个批量归一化层;
除最后一层全连接层的输出使用softmax激活函数,其余各层的激活函数均为线性整流函数。
4.根据权利要求1所述的基于深度学习的平滑语音检测方法,其特征在于,所述将得到的语音信号的离散余弦变换系数、输入平滑语音检测网络进行训练,得到具有识别平滑语音能力的网络模型的步骤包括:
将语音信号的离散余弦变换系数输入到设置的所述平滑语音检测网络中,以监督学习的方式,通过基于梯度下降的反向传播算法来更新网络权值。
5.根据权利要求1所述的基于...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。