欺骗检测装置、欺骗检测方法和计算机可读存储介质制造方法及图纸

技术编号：32261986 阅读：20 留言：0更新日期：2022-02-12 19:22

一种欺骗检测装置(100)，其包括多通道频谱图创建单元(10)和评估单元(40)。多通道频谱图创建单元(10)从语音数据提取不同类型的频谱图并整合不同类型的频谱图以创建多通道频谱图。评估单元(40)通过将创建的多通道频谱图应用于使用被标记的多通道频谱图作为训练数据构建的分类器来评估创建的多通道频谱图，并将其分类为真实的或欺骗的。将其分类为真实的或欺骗的。将其分类为真实的或欺骗的。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】欺骗检测装置、欺骗检测方法和计算机可读存储介质

[0001]本专利技术涉及一种从语音中检测欺骗的装置和方法，以及存储用于实现这些的程序的计算机可读存储介质。

技术介绍

[0002]说话人识别是指从其声音识别人。自动说话人识别(ASV)为个人身份验证提供了灵活的生物识别解决方案。它已经越来越多地应用于取证、基于电话的服务，诸如电话银行、呼叫中心以及许多大众市场的消费产品。
[0003]但是，ASV技术的适用性取决于对故意规避(称为欺骗)的弹性。与任何其他生物识别技术一样，ASV容易受到欺骗。已确认的针对ASV的欺骗攻击包括模拟、重放、文本到语音的语音合成和声音转换(例如，NPL 1)。欺诈者可以使用欺骗攻击来渗透使用生物识别技术保护的系统或服务。
[0004]因此，需要使用反欺骗技术来确保ASV在生物特征认证中的实用性。具有高斯混合模型(GMM)的恒定Q倒谱系数(CQCC：Constant Q Cepstral coefficient)特征是ASV中欺骗检测的标准系统。最近，通过直接使用常数Q变换(CQT)频谱图(从中提取CQCC特征)以及深度神经网络(DNN)(尤其是卷积神经网络(CNN))，已经实现了更高的精度。
[0005][引用列表][0006][非专利文献][0007][NPL 1][0008]Galina Lavrentyeva,et al.“Audio replay attack detection with deep learning frameworks”,INTERSPEEC...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种欺骗检测装置，包括：多通道频谱图创建装置，所述多通道频谱图创建装置从语音数据提取不同类型的频谱图，并整合所述不同类型的频谱图以创建多通道频谱图，评估装置，所述评估装置通过将所创建的多通道频谱图应用于使用被标记的多通道频谱图作为训练数据而构建的分类器来评估所创建的多通道频谱图，并且将所创建的多通道频谱图分类为真实或欺骗的。2.根据权利要求1所述的欺骗检测装置，还包括：分类器训练装置，所述分类器训练装置使所述多通道频谱图创建装置从要被采样的所述语音数据创建多通道频谱图，并且使用所创建的多通道频谱图和与所述语音数据对应的标签作为训练数据来构建所述分类器。3.根据权利要求1或2所述的欺骗检测装置，其中，所述多通道频谱图创建装置通过堆叠所述不同类型的频谱图来整合所述不同类型的频谱图。4.根据权利要求1或2所述的欺骗检测装置，其中，所述多通道频谱图创建装置通过连结所述不同类型的频谱图来整合所述不同类型的频谱图。5.根据权利要求1至4中的任一项所述的欺骗检测装置，其中，所述多通道频谱图创建装置在创建所述多通道频谱图之前，将所...

【专利技术属性】
技术研发人员：王琼琼，李功益，越仲孝文，
申请(专利权)人：日本电气株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人