【技术实现步骤摘要】
语音鉴别方法及相关装置、电子设备和存储介质
[0001]本申请涉及语音处理
,特别是涉及一种语音鉴别方法及相关装置、电子设备和存储介质。
技术介绍
[0002]语音鉴别如今已经广泛应用于门禁系统、养老识别系统等众多方面。随着语音技术的发展,特别是高效语音合成等算法的提出,高质量的合成语音足以让人难以分辨真假。这一现状给现有的验证系统也带来了极大挑战。
[0003]目前,语音鉴别通常依赖于在前端提取声学特征,一般包括短时幅频特征、短时相频特征等,但这些人工设计的特征往往具有明显的针对性,不具备良好的泛化能力,在面对合成得到的虚假语音时往往难以达到令人满意的检测能力。有鉴于此,如何提升语音鉴别的准确性成为亟待解决的问题。
技术实现思路
[0004]本申请主要解决的技术问题是提供一种语音鉴别方法及相关装置、电子设备和存储介质,能够提升语音鉴别的准确性。
[0005]为了解决上述技术问题,本申请第一方面提供了一种语音鉴别方法,包括:对语音数据进行第一特征提取,得到第一语音特征;其中,语音数据包括 ...
【技术保护点】
【技术特征摘要】
1.一种语音鉴别方法,其特征在于,包括:对语音数据进行第一特征提取,得到第一语音特征;其中,所述语音数据包括从待鉴别语音的时域波形上采样得到的若干数据点;基于所述第一语音特征,划分得到顺序排列的多个语音子特征;对于各个所述语音子特征,将所述语音子特征与其前一个所述语音子特征进行特征交互,得到所述语音子特征对应的交互子特征,并基于各个所述语音子特征对应的交互子特征,得到融合语音特征;基于所述融合语音特征进行真假预测,得到所述待鉴别语音的鉴别结果;其中,所述鉴别结果包括所述待鉴别语音为真实语音、所述待鉴别语音为虚假语音中任一者。2.根据权利要求1所述的方法,其特征在于,所述将所述语音子特征与其前一个所述语音子特征进行特征交互,得到所述语音子特征对应的交互子特征,包括:分别将各个所述语音子特征作为当前子特征,并提取所述当前子特征的前一个所述语音子特征的第一尺度特征;结合所述当前子特征与所述第一尺度特征,提取得到所述当前子特征对应的第二尺度特征,作为所述当前子特征对应的交互子特征;其中,所述第一尺度特征与所述当前子特征具有相同尺度,且与所述第二尺度特征具有不同尺度。3.根据权利要求2所述的方法,其特征在于,所述结合所述当前子特征与所述第一尺度特征,提取得到所述当前子特征对应的第二尺度特征,包括:将所述当前子特征与其前一个所述语音子特征提取得到的第一尺度特征进行融合,得到所述当前子特征对应的融合子特征;对所述融合子特征进行特征提取,得到所述当前子特征对应的第二尺度特征。4.根据权利要求1所述的方法,其特征在于,所述基于各个所述语音子特征对应的交互子特征,得到融合语音特征,包括:将各个所述语音子特征对应的交互子特征进行拼接,得到拼接语音特征;将所述第一语音特征和所述拼接语音特征进行融合,得到所述融合语音特征。5.根据权利要求1所述的方法,其特征在于,在所述基于所述融合语音特征进行真假预测,得到所述待鉴别语音的鉴别结果之前,所述方法还包括:检测当前已经执行特征划分的总轮数;响应于所述总轮数不高于轮数阈值,将最新得到的融合语音特征作为新的第一语音特征,并重新执行所述基于所述第一语音特征,划分得到顺序排列的多个语音子特征的步骤以及后续步骤。6.根据权利要求1所述的方法,其特征在于,所述基于所述融合语音特征进行真假预测,得到所述待鉴别语音的鉴别结果,包括:对所述融合语音特征进行第二特征提取,得到第二语音特征;基于所述第二语音特征进行真假预测,得到所述鉴别结果。7.根据权利要求1所述的方法,其特征在于,所述鉴别结果是利用语音鉴别模型对所述语音数据进行鉴别得到的,且所述语音鉴别模型包括第一特征提取网络、交互特征提取网络和真假预测网络;
其中,所述第一特征提取网络用于执行所述第一特征提取,所述交互特征提取网络用于执行所述基于所述第一语音特征,划分得到顺序排列的多个语音子特征的步骤以及后续步骤,所述真假预测网络用于执行所述真假预测。8.根据权利要求7所述的方法,其特征在于,所述交互特征提取网络包括至少一个顺序连接的双路径特征提取块,所述双路径特征提取块包括第一卷积核和第二卷积核,所述第一卷积核用于提取各个所述语音子特征前一个所述语音子特征的第一尺度特征,所述第二卷积核用于提取融合子特征的第二尺度特征作为所述交互子特征,所述融合子特征是由所述语音子特征及其...
【专利技术属性】
技术研发人员:张聿晗,方昕,高天,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。