当前位置: 首页 > 专利查询>鹏城实验室专利>正文

语音对抗样本检测方法、装置、终端设备以及存储介质制造方法及图纸

技术编号:26532826 阅读:10 留言:0更新日期:2020-12-01 14:17
本发明专利技术公开一种语音对抗样本检测方法,所述方法包括以下步骤:获取待检测语音信息;利用预设优化算法对所述待检测语音信息进行优化,获得预处理语音信息;基于所述预处理语音信息和所述待检测语音,获得语音信息集;将所述语音信息集中的语音信息分别输入语音识别模型中进行识别,获得语音识别结果集;基于所述语音识别结果集,获得所述语音识别结果集的相似度得分矩阵;基于所述相似度得分矩阵,获得所述待检测语音信息的语音对抗样本检测结果。本发明专利技术还公开了一种语音对抗样本检测装置、终端设备以及存储介质。可以对待检测语音中的未知语音对抗样本进行检测。

【技术实现步骤摘要】
语音对抗样本检测方法、装置、终端设备以及存储介质
本专利技术涉及语音识别
,特别涉及一种语音对抗样本检测方法、装置、终端设备以及存储介质。
技术介绍
随着科技的快速发展,语音识别技术逐渐成为人们生活中的关键技术之一。智能设备通过对输入的语音信息提取相关信息并加以处理,可以转录处正确的文字内容,甚至实现和人们的交流互动。随着研究者的不懈努力,语音识别技术逐渐走向成熟,识别精度不断提高,应用范围也不断扩大,为人们的生产生活带来了极大的便利。然而最新的科学研究表明,语音信息常常包括对抗样本。攻击者通过在原始语音信息中添加经过精心计算后的微小扰动,使得语音信息被识别为错误的短语,而这种扰动通常是人耳所不能察觉的。在现实生活场景中,这些扰动可能让原始语音信息转录成截然不同的短语,使得被控制的智能设备做出错误的操作,甚至有可能造成隐私的泄露或者带来安全威胁。但是,现有的语音识别技术只能对已知的语音对抗样本进行清除,无法对未知的对抗样本进行防御。
技术实现思路
本专利技术的主要目的是提供一种语音对抗样本检测方法、装置、终端设备以及存储介质,旨在解决现有技术中只能对已知的语音对抗样本进行清除,无法对未知的对抗样本进行防御的技术问题。为实现上述目的,本专利技术提出的一种语音对抗样本检测方法,所述方法包括以下步骤:获取待检测语音信息;利用预设优化算法对所述待检测语音信息进行优化,获得预处理语音信息;基于所述预处理语音信息和所述待检测语音,获得语音信息集;将所述语音信息集中的语音信息分别输入语音识别模型中进行识别,获得语音识别结果集;基于所述语音识别结果集,获得所述语音识别结果集的相似度得分矩阵;基于所述相似度得分矩阵,获得所述待检测语音信息的语音对抗样本检测结果。可选的,所述预设优化算法包括多种预设优化算法;所述利用预设优化算法对所述待检测语音信息进行优化,获得预处理语音信息的步骤包括:利用所述多种预设优化算法分别对所述待检测语音信息进行优化,获得多个预处理语音信息;所述基于所述预处理语音信息和所述待检测语音信息,获得语音信息集的步骤包括:基于所述多个预处理语音信息和所述待检测语音信息,获得语音信息集。可选的,所述语音识别模型包括多个不同的语音识别模型;将所述语音信息集中的语音信息分别输入语音识别模型中进行识别,获得语音识别结果集的步骤包括:将所述语音信息集中的每个语音信息输入所述多个不同的语音识别模型中进行识别,获得所述每个语音信息的多个语音识别结果;基于所述每个语音信息的多个语音识别结果,获得语音识别结果集。可选的,基于所述语音识别结果集,获得所述语音识别结果集的相似度得分矩阵的步骤包括:对所述语音识别结果集中的任意两个语音识别结果计算相似度得分,获得所述语音识别结果集的相似度得分矩阵。可选的,所述基于所述相似度得分矩阵,获得所述待检测语音信息的语音对抗样本检测结果的步骤包括:基于所述相似度得分矩阵,获得所述相似度得分矩阵的标准差;基于预设阈值和所述标准差,获得所述待检测语音信息的语音对抗样本检测结果。可选的,所述对所述语音识别结果集中的任意两个语音识别结果计算相似度得分,获得所述语音识别结果集的相似度得分矩阵的步骤包括:利用Jaro-Winkler算法,对所述语音识别结果集中的任意两个语音识别结果计算相似度得分,获得所述语音识别结果集的相似度得分矩阵。可选的,所述多种预设优化算法包括MP3压缩法、中值滤波法、带通滤波法和高斯噪声法;所述多个不同的语音识别模型包括DeepSpeech、DeepSpeech2、GoogleCloudSpeech和AmazonTranscribe。此外,为实现上述目的,本专利技术还提出了一种语音对抗样本检测装置,所述装置包括:获取模块,用于获取待检测语音信息;优化模块,用于利用预设优化算法对所述待检测语音信息进行优化,获得预处理语音信息;获得模块,用于基于所述预处理语音信息和所述待检测语音,获得语音信息集;识别模块,用于将所述语音信息集中的语音信息分别输入语音识别模型中进行识别,获得语音识别结果集;矩阵获得模块,用于基于所述语音识别结果集,获得所述语音识别结果集的相似度得分矩阵;检测结果获得模块,用于基于所述相似度得分矩阵,获得所述待检测语音信息的语音对抗样本检测结果。此外,为实现上述目的,本专利技术还提出了一种终端设备,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音对抗样本检测程序,所述语音对抗样本检测程序配置为实现如上述任一项所述的语音对抗样本检测方法的步骤。此外,为实现上述目的,本专利技术还提出了一种存储介质,所述存储介质上存储有语音对抗样本检测程序,所述语音对抗样本检测程序被处理器执行时实现上述任一项所述的终端方法的步骤。本专利技术技术方案通过采用一种语音对抗样本检测方法,通过获取待检测语音信息;利用预设优化算法对所述待检测语音信息进行优化,获得预处理语音信息;基于所述预处理语音信息和所述待检测语音,获得语音信息集;将所述语音信息集中的语音信息分别输入语音识别模型中进行识别,获得语音识别结果集;基于所述语音识别结果集,获得所述语音识别结果集的相似度得分矩阵;基于所述相似度得分矩阵,获得所述待检测语音信息的语音对抗样本检测结果。由于,包含语音对抗样本的语音信息对应的相似度得分矩阵与不包含语音对抗样本的语音信息对应的相似度得分矩阵是不同的,利用待检测语音信息对应的相似度得分矩阵,可以判断待检测语音信息中是否包括语音对抗样本,所以,通过本专利技术的语音对抗样本检测方法,可以对待检测语音中的未知语音对抗样本进行检测,进而可以对未知语音对抗样本进行防御。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。图1为本专利技术实施例方案涉及的硬件运行环境的终端设备结构示意图;图2为本专利技术语音对抗样本检测方法第一实施例的流程示意图;图3为本专利技术DeepSpeech包括的RNN结构示意图;图4为本专利技术DeepSpeech2的结构示意图;图5为本专利技术语音对抗样本检测装置第一实施例的结构框图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。参照图1,图1为本专利技术实施例方案涉及的硬件运行环境的本文档来自技高网...

【技术保护点】
1.一种语音对抗样本检测方法,其特征在于,所述方法包括以下步骤:/n获取待检测语音信息;/n利用预设优化算法对所述待检测语音信息进行优化,获得预处理语音信息;/n基于所述预处理语音信息和所述待检测语音,获得语音信息集;/n将所述语音信息集中的语音信息分别输入语音识别模型中进行识别,获得语音识别结果集;/n基于所述语音识别结果集,获得所述语音识别结果集的相似度得分矩阵;/n基于所述相似度得分矩阵,获得所述待检测语音信息的语音对抗样本检测结果。/n

【技术特征摘要】
1.一种语音对抗样本检测方法,其特征在于,所述方法包括以下步骤:
获取待检测语音信息;
利用预设优化算法对所述待检测语音信息进行优化,获得预处理语音信息;
基于所述预处理语音信息和所述待检测语音,获得语音信息集;
将所述语音信息集中的语音信息分别输入语音识别模型中进行识别,获得语音识别结果集;
基于所述语音识别结果集,获得所述语音识别结果集的相似度得分矩阵;
基于所述相似度得分矩阵,获得所述待检测语音信息的语音对抗样本检测结果。


2.如权利要求1所述的语音对抗样本检测方法,其特征在于,所述预设优化算法包括多种预设优化算法;所述利用预设优化算法对所述待检测语音信息进行优化,获得预处理语音信息的步骤包括:
利用所述多种预设优化算法分别对所述待检测语音信息进行优化,获得多个预处理语音信息;
所述基于所述预处理语音信息和所述待检测语音信息,获得语音信息集的步骤包括:
基于所述多个预处理语音信息和所述待检测语音信息,获得语音信息集。


3.如权利要求2所述的语音对抗样本检测方法,其特征在于,所述语音识别模型包括多个不同的语音识别模型;将所述语音信息集中的语音信息分别输入语音识别模型中进行识别,获得语音识别结果集的步骤包括:
将所述语音信息集中的每个语音信息输入所述多个不同的语音识别模型中进行识别,获得所述每个语音信息的多个语音识别结果;
基于所述每个语音信息的多个语音识别结果,获得语音识别结果集。


4.如权利要求3所述的语音对抗样本检测方法,其特征在于,基于所述语音识别结果集,获得所述语音识别结果集的相似度得分矩阵的步骤包括:
对所述语音识别结果集中的任意两个语音识别结果计算相似度得分,获得所述语音识别结果集的相似度得分矩阵。


5.如权利要求4所述的语音对抗样本检测方法,其特征在于,所述基于所述相似度得分矩阵,获得所述待检测语音信息的语音对抗样本检测结果的步骤包括:
基于所述相似度得...

【专利技术属性】
技术研发人员:黄浩艾建文张伟哲张宾钟晓雄
申请(专利权)人:鹏城实验室
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1