System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 针对健康隐私上下文模糊音频样本制造技术_技高网

针对健康隐私上下文模糊音频样本制造技术

技术编号:41902713 阅读:20 留言:0更新日期:2024-07-05 14:08
训练监督判别器以检测音频样本数据集中的生物标记,并且训练去噪自动编码器以学习用于重构具有与所述音频样本数据集的输入音频样本相同的保真度的输出音频样本的隐空间。训练条件辅助生成对抗网络(GAN)以生成具有与输入音频样本相同的保真度的输出音频样本,其中输出音频样本没有生物标记。条件辅助生成对抗网络(GAN)、对应的监督判别器和对应的去噪自动编码器被部署在音频处理系统中。

【技术实现步骤摘要】
【国外来华专利技术】

本专利技术涉及电气、电子和计算机领域,并且更具体地涉及音频处理系统。


技术介绍

1、人类语音的数字表示携带关于语音所有者的大量信息,包括个体可能不希望向第三方公开的潜在健康状况的指示符。然而,这些表示和表示过程不是由其语音被数字化的个体直接控制的。此外,音频表示越来越多地被预测模型用于预测疾病的早期发作或识别疾病在各种状况中的存在,所述状况包括中枢神经系统(cns)障碍、抑郁症、自闭症谱系障碍、病毒感染、甚至心脏病。当个人的语音被分析用于健康诊断目的时,个人通常不知道,并且即使当个人知道时,特征通常不可见地与个人的语音的音频相联系,并且不能容易地被省略。


技术实现思路

1、本专利技术的原理提供了用于针对健康隐私上下文模糊音频样本的技术。根据本专利技术的一个方面,提供了一种方法,包括以下操作:使用至少一个处理器训练监督判别器以检测音频样本数据集中的生物标记;使用所述至少一个处理器训练去噪自动编码器以学习用于重构具有与所述音频样本数据集的输入音频样本相同的保真度的输出音频样本的隐空间;使用所述至少一个处理器训练条件辅助生成对抗网络(gan)以生成具有与所述输入音频样本相同的保真度的所述输出音频样本,其中所述输出音频样本没有所述生物标记;以及在音频处理系统中部署所述条件辅助生成对抗网络(gan)、对应的监督判别器和对应的去噪自动编码器。

2、根据本专利技术的另一方面,提供了一种装置,包括:存储器和至少一个处理器,所述至少一个处理器耦合到所述存储器,并且可操作以执行包括以下的操作:训练监督判别器以检测音频样本数据集中的生物标记;训练去噪自动编码器以学习用于重构具有与所述音频样本数据集的输入音频样本相同的保真度的输出音频样本的隐空间;训练条件辅助生成对抗网络(gan)以生成具有与所述输入音频样本相同的保真度的所述输出音频样本,其中所述输出音频样本没有所述生物标记;以及在音频处理系统中部署所述条件辅助生成对抗网络(gan)、对应的监督判别器和对应的去噪自动编码器。

3、根据本专利技术的另一方面,提供了一种用于联合学习的计算机程序产品,所述计算机程序产品包括具有随其体现的程序指令的计算机可读存储介质,所述程序指令可由计算机执行以使所述计算机执行包括以下的操作:训练监督判别器以检测音频样本数据集中的生物标记;训练去噪自动编码器以学习用于重构具有与所述音频样本数据集的输入音频样本相同的保真度的输出音频样本的隐空间;训练条件辅助生成对抗网络(gan)以生成具有与所述输入音频样本相同的保真度的所述输出音频样本,其中所述输出音频样本没有所述生物标记;以及在音频处理系统中部署所述条件辅助生成对抗网络(gan)、对应的监督判别器和对应的去噪自动编码器。

4、如本文所使用的,“促进”动作包括执行动作、使动作更容易、帮助执行动作、或使得动作被执行。因此,作为示例而非限制,在一个处理器上执行的指令可以通过发送适当的数据或命令以促使或帮助要执行的动作来促进由在远程处理器上执行的指令所执行的动作。为了避免疑惑,在行动者通过执行动作之外的动作来促进动作的情况下,该动作仍然由某个实体或实体的组合来执行。

5、本专利技术的一个或多个实施例或其元件可以以计算机程序产品的形式实现,该计算机程序产品包括具有用于执行所示方法步骤的计算机可用程序代码的计算机可读存储介质。此外,本专利技术的一个或多个实施例或其元件可以以系统(或装置)的形式实现,该系统(或装置)包括存储器和至少一个处理器,该处理器耦合到存储器并且操作用于执行示例性方法步骤。此外,在另一方面,本专利技术的一个或多个实施例或其元件可以以用于执行本文描述的一个或多个方法步骤的装置的形式来实现;所述装置可以包括(i)硬件模块,(ii)存储在计算机可读存储介质(或多个这样的介质)中并在硬件处理器上实现的软件模块,或(iii)(i)和(ii)的组合;(i)-(iii)中的任何一个实现这里阐述的特定技术。

6、本专利技术的技术可以提供实质上有益的技术效果。例如,一个或多个实施例提供以下中的一个或多个:具有嵌入式生物标记混淆能力的音频编解码器;一种混淆方法,其有效地混淆音频样本,从而隐藏可以由预测模型使用以推断健康状况的特征;适用于智能手表、智能电话、家庭设备等的模糊技术;通过掩蔽指示个人的隐私特征的语音特性来防止侵犯隐私,同时允许话音/音频保持可理解,对在呼叫中心、交互式语音响应(ivr)系统、语音识别应用等中使用的计算机化音频处理系统的隐私和安全性的技术改进;以及模糊方法,其是生物标记不可知的并且维持音频样本的质量和保真度而不影响压缩计算时间。

7、一些实施例可能不具有这些潜在优点,并且这些潜在优点并非所有实施例都必需。通过结合附图阅读的本专利技术的说明性实施例的以下详细描述,本专利技术的这些和其它特征和优点将变得显而易见。

本文档来自技高网...

【技术保护点】

1.一种方法,包括:

2.根据权利要求1所述的方法,还包括在所述监督判别器的训练期间最小化分类泛化误差。

3.根据权利要求1所述的方法,其中通过使基于KL散度的重构误差损失加保真项最小化来执行所述去噪自动编码器学习用于重构所述输出音频样本的所述隐空间的训练。

4.根据权利要求3所述的方法,其中所述基于KL散度的重构误差损失加上所述保真项是基于频率响应、失真、噪声和基于时间的误差中的一个或多个。

5.根据权利要求1所述的方法,还包括使用判别函数作为条件辅助生成对抗网络(GAN)中的监督判别器,并且使用所述去噪自动编码器作为生成器,所述条件辅助生成对抗网络(GAN)被训练使得所述判别函数尝试最大化干净样本通过所述判别器的熵并且最小化包含所述生物标记的坏样本的去噪表示通过所述监督判别器的熵。

6.根据权利要求5所述的方法,还包括冻结所述生成器并且使用来自生成对抗网络损失的梯度来反向传播通过所述判别函数。

7.根据权利要求6所述的方法,还包括冻结所述判别函数,并且使用来自所述生成对抗网络损失的所述梯度结合衰减常数乘以所述生成器的重构误差损失来传播通过所述生成器。

8.根据权利要求1所述的方法,还包括迭代所述去噪自动编码器的训练和所述条件辅助生成对抗网络的训练直到收敛。

9.根据权利要求1所述的方法,其中所述监督判别器包括卷积神经网络,所述卷积神经网络输入所述音频样本数据集的梅尔频率倒谱系数(MFCC)表示,并且对所述生物标记的存在进行分类,其中第一分类表示存在对应的生物标记,并且第二分类表示不存在所述对应的生物标记。

10.根据权利要求1所述的方法,还包括经由模型提炼从黑匣子教师模型创建所述监督判别器。

11.根据权利要求1所述的方法,其中,所述监督判别器的训练基于从所述音频样本数据集的梅尔表示提取的特征。

12.根据权利要求1所述的方法,其中,所述去噪自动编码器包括卷积神经网络,所述卷积神经网络输入所述音频样本数据集的MFCC表示并产生所述MFCC表示的去噪版本。

13.根据权利要求1所述的方法,还包括使用所述条件辅助生成对抗网络(GAN)、所述对应的监督判别器和所述对应的去噪自动编码器来混淆人类主体的话音的一个或多个生物标记,使得所述音频处理系统能够访问所述话音的可理解版本,但是不能访问所述人类主体的所述一个或多个生物标记。

14.一种装置,包括:

15.根据权利要求14所述的装置,所述操作还包括在所述监督判别器的训练期间最小化分类泛化误差。

16.根据权利要求14所述的装置,其中,通过使基于KL散度的重构误差损失加保真项最小化来执行所述去噪自动编码器学习用于重构所述输出音频样本的所述隐空间的训练。

17.根据权利要求14所述的装置,其中,所述操作还包括使用判别函数作为条件辅助生成对抗网络(GAN)中的监督判别器,并且使用所述去噪自动编码器作为生成器,所述条件辅助生成对抗网络(GAN)被训练使得所述判别函数尝试最大化干净样本通过所述判别器的熵并且最小化包含所述生物标记的坏样本的去噪表示通过所述监督判别器的熵。

18.根据权利要求17所述的装置,所述操作还包括冻结所述生成器并且使用来自生成对抗网络损失的梯度来反向传播通过所述判别函数。

19.根据权利要求18所述的装置,所述操作还包括冻结所述判别函数,并且使用来自所述生成对抗网络损失的所述梯度结合衰减常数乘以所述生成器的重构误差损失来传播通过所述生成器。

20.一种用于联合学习的计算机程序产品,所述计算机程序产品包括计算机可读存储介质,所述计算机可读存储介质具有随其体现的程序指令,所述程序指令可由计算机执行以使所述计算机执行根据权利要求1至13所述的方法。

...

【技术特征摘要】
【国外来华专利技术】

1.一种方法,包括:

2.根据权利要求1所述的方法,还包括在所述监督判别器的训练期间最小化分类泛化误差。

3.根据权利要求1所述的方法,其中通过使基于kl散度的重构误差损失加保真项最小化来执行所述去噪自动编码器学习用于重构所述输出音频样本的所述隐空间的训练。

4.根据权利要求3所述的方法,其中所述基于kl散度的重构误差损失加上所述保真项是基于频率响应、失真、噪声和基于时间的误差中的一个或多个。

5.根据权利要求1所述的方法,还包括使用判别函数作为条件辅助生成对抗网络(gan)中的监督判别器,并且使用所述去噪自动编码器作为生成器,所述条件辅助生成对抗网络(gan)被训练使得所述判别函数尝试最大化干净样本通过所述判别器的熵并且最小化包含所述生物标记的坏样本的去噪表示通过所述监督判别器的熵。

6.根据权利要求5所述的方法,还包括冻结所述生成器并且使用来自生成对抗网络损失的梯度来反向传播通过所述判别函数。

7.根据权利要求6所述的方法,还包括冻结所述判别函数,并且使用来自所述生成对抗网络损失的所述梯度结合衰减常数乘以所述生成器的重构误差损失来传播通过所述生成器。

8.根据权利要求1所述的方法,还包括迭代所述去噪自动编码器的训练和所述条件辅助生成对抗网络的训练直到收敛。

9.根据权利要求1所述的方法,其中所述监督判别器包括卷积神经网络,所述卷积神经网络输入所述音频样本数据集的梅尔频率倒谱系数(mfcc)表示,并且对所述生物标记的存在进行分类,其中第一分类表示存在对应的生物标记,并且第二分类表示不存在所述对应的生物标记。

10.根据权利要求1所述的方法,还包括经由模型提炼从黑匣子教师模型创建所述监督判别器。

11.根据权利要求1所述的方法,其中,所述监督判别器的训练基于从所述音频样本数据集的梅尔表示提取的特征...

【专利技术属性】
技术研发人员:V·A·阿金万德C·辛塔斯K·维尔德玛瑞阿姆A·沃尔科特
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1