基于声纹特征混淆的说话人隐私保护方法及系统技术方案

技术编号：46562990 阅读：1 留言：0更新日期：2025-10-10 21:14

本发明专利技术公开了一种基于声纹特征混淆的说话人隐私保护方法及系统，包括：获取说话人的语音信号以及属于该说话人的参考语音并切分原始语音序列和参考语音序列；获取两序列的原始声纹识别置信度，并形成原始二元掩码序列；将原始语音序列与原始二元掩码序列相乘形成初始隐私语音序列，将原始语音序列与初始隐私语音序列分别转成文本，对比两文本之间的相似度，基于相似度优化原始二元掩码序列形成新的二元掩码序列；不断优化二元掩码序列并更新隐私语音序列；将最新的隐私语音序列所对应的隐私语音输出，完成语音隐私保护，本方法能够对说话人语音信息中的声纹特征进行消除，同时保障其能被人类和语音内容识别模型正确理解和识别。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及信息安全，具体为一种基于声纹特征混淆的说话人隐私保护方法及系统。

技术介绍

1、随着人工智能技术的快速发展，语音识别技术已经被越来越多的应用在日常生活中，如智能客服、语音通话等。然而，这些语音信息被第三方获取后存在隐私泄露的风险，例如，不可信的第三方机构可以通过分离语音信号中的声纹信息推测用户的真实身份，甚至提取该用户的声纹信息进行深度伪造从而实施诈骗等犯罪活动。因此，确保语音识别技术在输出完整的语音内容的同时，也必须考虑到保护用户的个人隐私。

2、然而，声纹信息与语音内容信息高度耦合，简单的消除某些与说话人身份强相关的关键音素会造成原始语音的可听性下降，也会影响语音内容识别模型的输出准确率，这使得相关的技术在现实生活中难以应用。因此，亟需对语音信息中的声纹信息进行消除，同时保证其内容信息依旧可以被人类和机器识别，保障其可听性和可理解性的同时保护用户的个人隐私不被泄露。

技术实现思路

1、本专利技术提供了一种基于声纹特征混淆的说话人隐私保护方法及系统，能够对说话人...

【技术保护点】

1.一种基于声纹特征混淆的说话人隐私保护方法，其特征在于，包括：

2.根据权利要求1所述的基于声纹特征混淆的说话人隐私保护方法，其特征在于：S1中，将语音信号和参考语音以音素为最小单位分割为长度为N的原始语音序列和参考语音序列。

3.根据权利要求1或2所述的基于声纹特征混淆的说话人隐私保护方法，其特征在于：S2中，采用声纹识别模型获取原始语音序列和参考语音序列的原始声纹识别置信度，基于原始声纹识别置信度获取长度为N的梯度序列，并依据符号函数将梯度序列转化为原始二元掩码序列。

4.根据权利要求1所述的基于声纹特征混淆的说话人隐私保护方法，其特征在于：S2...

【技术特征摘要】

1.一种基于声纹特征混淆的说话人隐私保护方法，其特征在于，包括：

2.根据权利要求1所述的基于声纹特征混淆的说话人隐私保护方法，其特征在于：s1中，将语音信号和参考语音以音素为最小单位分割为长度为n的原始语音序列和参考语音序列。

3.根据权利要求1或2所述的基于声纹特征混淆的说话人隐私保护方法，其特征在于：s2中，采用声纹识别模型获取原始语音序列和参考语音序列的原始声纹识别置信度，基于原始声纹识别置信度获取长度为n的梯度序列，并依据符号函数将梯度序列转化为原始二元掩码序列。

4.根据权利要求1所述的基于声纹特征混淆的说话人隐私保护方法，其特征在于：s2中，基于原始声纹识别置信度获取梯度信息包括：

5.根据权利要求1或4所述的基于声纹特征混淆的说话人隐私保护方法，其特征在于：s3中，通过余弦距离对比两文本之间的距离，以该距离作为目标函数并使用遗传算法优化原始二元掩码序列形成新的二元掩码序列。

6.根据权利要求1所述的基于声纹特征混淆的说话人隐私保护方...

【专利技术属性】
技术研发人员：陈喆，谭晓晟，吕杨铈，赵伟，
申请(专利权)人：浙江移动数智科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人