一种基于特征聚类的语音鉴伪方法及相关设备技术

技术编号：43986538 阅读：13 留言：0更新日期：2025-01-10 20:09

本申请属于人工智能和大数据领域，应用于智慧城市领域中，涉及一种基于特征聚类的语音鉴伪方法，包括：获取语音训练数据集，通过所述音频训练数据集对预训练语音鉴伪模型进行训练，得到训练好的语音鉴伪模型，所述语音训练数据集包括赛道数据集中音频；通过所述训练好的语音鉴伪模型对目标音频进行特征序列提取处理，得到目标音频特征序列；使用K最近邻法对所述目标音频特征序列进行鉴伪处理，确定出所述目标音频的鉴伪处理结果。本申请还提供一种基于特征聚类的语音鉴伪装置、计算机设备及存储介质。本申请解决了现有语音鉴伪方法存在运行效率和准确率较低的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能和大数据，尤其涉及一种基于特征聚类的语音鉴伪方法及相关设备。

技术介绍

1、随着deepfake技术的发展，生成高度逼真的假人声音频变得较为容易，主流的语音生成方法主要分为两种形式，一种是通过一段文件合成目标任务的说话音频，即tts。另一种是将源说话人的声音转为目标说话人的声音，并且保持音频内容不变，即语音转换vc。卷积神经网络的发展促使生成式语音越来越逼真，这些技术在带来便利和娱乐的同时，也增加了语音诈骗和语音造假的风险，不排除不法分子利用这些技术恶意伪造他人音频来实施诈骗、非法获取他人信息或滋生事端等违法行为。

2、现有语音鉴伪方法通常是提取待检测音频测某种特征然后送入分类网络进行分类，这就导致模型的效果较大程度上依赖于特征提取模块和分类网络的设计。因此急需一种基于特征聚类的语音鉴伪方法，解决现有语音鉴伪方法存在运行效率和准确率较低的问题。

技术实现思路

1、本申请实施例的目的在于提出一种基于特征聚类的语音鉴伪方法及相关设备，以解决现有语音鉴伪方法存在运行...

【技术保护点】

1.一种基于特征聚类的语音鉴伪方法，其特征在于，包括下述步骤：

2.根据权利要求1所述的基于特征聚类的语音鉴伪方法，其特征在于，所述获取语音训练数据集之后，所述方法还包括：

3.根据权利要求2所述的基于特征聚类的语音鉴伪方法，其特征在于，所述使用K最近邻法对所述语音训练数据集的特征序列进行聚类计算处理，构建得到特征检索库，包括：

4.根据权利要求3所述的基于特征聚类的语音鉴伪方法，其特征在于，在语音鉴伪模型在训练过程中采用损失函数对模型进行约束，公式如下式：

5.根据权利要求4所述的基于特征聚类的语音鉴伪方法，其特征在于，所述使用K最近邻法...

【技术特征摘要】

1.一种基于特征聚类的语音鉴伪方法，其特征在于，包括下述步骤：

2.根据权利要求1所述的基于特征聚类的语音鉴伪方法，其特征在于，所述获取语音训练数据集之后，所述方法还包括：

3.根据权利要求2所述的基于特征聚类的语音鉴伪方法，其特征在于，所述使用k最近邻法对所述语音训练数据集的特征序列进行聚类计算处理，构建得到特征检索库，包括：

4.根据权利要求3所述的基于特征聚类的语音鉴伪方法，其特征在于，在语音鉴伪模型在训练过程中采用损失函数对模型进行约束，公式如下式：

5.根据权利要求4所述的基于特征聚类的语音鉴伪方法，其特征在于，所述使用k最近邻法对所述目标音频特征序列进行鉴伪处理，确定出目标音频的鉴伪处理结果，包括：

6.根据权利要求5所述的基于特征聚类的语音鉴伪方法...

【专利技术属性】
技术研发人员：郑哲，马骏，王少军，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人