The invention discloses a method based on machine learning to control voice assistants with silent instructions. The steps are as follows: 1) acquisition of data of positive and negative samples, 2) data segmentation of positive and negative sample data; 3) sample feature selection and normalization; 4) select classifier to train and generate a detection model for malicious voice instruction. 5) use the detected model to detect voice commands. This invention selects the original feature selection method, for different types of intelligent devices, it is necessary to obtain normal voice commands and malicious voice commands through this type of intelligent equipment, and train a specific classifier for this type of equipment as positive and negative samples. Through this customized way, it can solve the problem that the cross device can not detect and defend well. One
【技术实现步骤摘要】
基于机器学习的防御无声指令控制语音助手的方法
本专利技术属于人工智能语音助手安全领域,具体涉及一种基于机器学习的防御无声指令控制语音助手的方法。
技术介绍
作为一种方便有效的人机交互方法,Siri,GoogleNow,Alexa,Cortana,SVoice,HiVoice等语音助手在人们的生活中变得越来越流行,几乎所有的智能设备(智能手机,平板电脑,可穿戴设备以及智能音响)都搭载着相应的语音助手。然而,语音助手也面临着各种各样的安全隐患,例如有一种名为“海豚音攻击”的方法[Zhang,G.,Yan,C.,Ji,X.,Zhang,T.,Zhang,T.,&Xu,W.(2017).DolphinAtack:InaudibleVoiceCommands.arXivpreprintarXiv:1708.09537.],利用智能设备麦克风电路的漏洞,可以无声地控制语音助手从而命令智能设备执行相应的指令,例如:无声的开启语音助手,拨打付费电话或者监听电话,视频通话,发送付费短信,将手机切换到飞行模式,操作奥迪汽车的导航系统,购物,甚至能够无声解锁Nexus7等。因此,攻击者可以在用户不知道的情况下操纵其智能设备,造成隐私泄露,财产损失等一系列的安全问题。攻击实现的过程如图1,攻击者首先将普通可听见的语音信号通过调幅的方式将其调制到超声波频段然后再通过超声波发送器发送出去,此时人耳是听不到。而智能设备的麦克风电路能够听到并且能够将该调幅信号进行解调,恢复出调制之前的语音信号,此时语音助手识别到该语音信号,并控制智能设备执行恶意的操作。虽然各种搭载语音助手的智能 ...
【技术保护点】
1.一种基于机器学习的防御无声指令控制语音助手的方法,其特征在于包括如下步
【技术特征摘要】
1.一种基于机器学习的防御无声指令控制语音助手的方法,其特征在于包括如下步骤:1)采集正负样本的数据,2)对采集到的正负样本数据进行数据切分;3)样本特征选取与归一化;对语音数据进行特征特取,特征包括,最小值、平均值、能量、偏度、峰度、频谱均值、频谱方差、频谱标准差、不规律性、均方根振幅、频谱质心,将选取的11个特征构成特征向量,特征向量代替采集到的语音数据,将其作为之后过程中的输入信息,其中各特征定义如下:平均值:能量:偏度:峰度:频谱均值:频谱方差:频谱标准差:不规律性:均方根振幅:频谱质心:其中,N为样本数据点数,xn是第n个点的功耗值,σ是标准差,an是进行频域变换后第n个频率fn处的能量大小,是频谱均值,Vs是频谱方差,z(n)是加权频率值,y(n)代表样本点的中心频率;对样本特征向量进行归一化处理,每个样本特征最大值设定为1,归一化处理的输入为每个样本的时域频域特征,输出为归一化的时域频域特征;最后,将归一化后的时频域特征贴上标签,正常语音指令特征的标签为1,恶意语音特...
【专利技术属性】
技术研发人员:徐文渊,冀晓宇,张国明,闫琛,张天晨,张泰民,
申请(专利权)人:浙江大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。