基于韵律特征的合成语音检测方法技术

技术编号：38680935 阅读：16 留言：0更新日期：2023-09-02 22:53

本发明专利技术属于合成语音检测技术领域，特别涉及一种基于韵律特征的合成语音检测方法，其中，合成语音检测方法包括以下步骤：获取待检测语音信号；根据预设的第一方式对待检测语音信号进行处理，得到声学特征；根据预设的第二方式对待检测语音信号进行处理，得到韵律特征；将声学特征与韵律特征拼接，得到特征向量；将特征向量输入预设的神经网络模型进行检测，得到检测结果。本发明专利技术提供的合成语音检测方法，通过提取语音中的韵律特征来鉴别深度合成语音和真实语音，提高了语音鉴别的准确性和鲁棒性。棒性。棒性。

全部详细技术资料下载

【技术实现步骤摘要】
基于韵律特征的合成语音检测方法

[0001]本专利技术涉及语音检测领域，尤其涉及一种基于韵律特征的合成语音检测方法。

技术介绍

[0002]语音是现代通讯和信息交流的重要形式之一。随着数字语音技术的不断发展，语音合成技术已经成为实现语音信息自动化的关键技术之一，被广泛应用于语音转换、语音合成、音乐生成等领域。然而，随着语音合成技术的广泛应用，一些不良分子利用语音合成技术进行网络欺诈、声音冒充等活动，严重威胁了网络安全和社会稳定。因此，如何准确、高效地检测合成语音具有重要的现实意义和应用价值。
[0003]近年来，针对声音防伪检测的研究主要集中在两个方面。首先是在特征层面的探索，其中高斯混合模型(Gaussian Mixture Model，GMM)分类器与常数Q倒谱系数(CQCC)的组合在各种反欺骗任务中受到了广泛的关注。CQCC特征是从常量Q变换(CQT)中提取的一种受感知启发的时频分析方法。然而，由于伪造声音和真实声音之间的相似性，单一特征无法完全展示出它们之间的差异，使得传统合成语音检测方法无法准确地区分伪造语音和真实声音之间的区别，可靠性较低。

技术实现思路

[0004]有鉴于此，本专利技术实施例提供了一种基于韵律特征的合成语音检测方法，用以解决传统合成语音检测方法的可靠性较低的技术问题。
[0005]第一方面，本专利技术实施例提供一种基于韵律特征的合成语音检测方法，包括以下步骤：获取待检测语音信号；根据预设的第一方式对所述待检测语音信号进行处理，得到声学特征；根据预设的第二方...

【技术保护点】

【技术特征摘要】
1.一种基于韵律特征的合成语音检测方法，其特征在于：包括以下步骤：获取待检测语音信号；根据预设的第一方式对所述待检测语音信号进行处理，得到声学特征；根据预设的第二方式对所述待检测语音信号进行处理，得到韵律特征；将所述声学特征与所述韵律特征拼接，得到特征向量；将所述特征向量输入预设的神经网络模型进行检测，得到检测结果。2.如权利要求1所述的合成语音检测方法，其特征在于：根据预设的第一方式对所述待检测语音信号进行处理包括以下步骤：对所述待检测语音信号进行预处理，得到第一中间语音信号；计算所述第一中间语音信号的功率谱，并进行梅尔滤波处理，得到梅尔频率谱；对所述梅尔频率谱进行离散余弦变换，将得到梅尔频率倒谱系数作为所述声学特征。3.如权利要求1所述的合成语音检测方法，其特征在于：根据预设的第二方式对所述待检测语音信号进行处理包括以下步骤：对所述待检测语音信号进行预处理，得到第二中间语音信号；从所述第二中间语音信号提取语音的音素时长信息和基频信息；将所述基频信息和所述音素时长信息进行融合，得到所述韵律特征。4.如权利要求1所述的合成语音检测方法，其特征在于：将所述基频信息和所述音素时长信息进行融合包括以下步骤：将所述音素时长信息进行归一化处理，然后处理结果与所述基频信息分别输入到两层CNN网络中，并分别提取固定64维度的表征向量，再将所述表征向量进行点乘，得到所述韵律特征。5....

【专利技术属性】
技术研发人员：温正棋，汪涛，
申请(专利权)人：中科极限元杭州智能科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人