信号处理方法及终端设备技术

技术编号:21118057 阅读:31 留言:0更新日期:2019-05-16 09:42
本发明专利技术涉及语音识别技术领域,提供一种信号处理方法及终端设备,该信号处理方法包括:从输入的信号中提取特征信息;根据提取的特征信息,确定输入的信号是否为非正常语音信号。本发明专利技术中,通过根据输入的信号中提取的特征信息来确定该输入的信号是否为非正常语音信号的处理过程,实现了对非正常语音信号的有效识别,提高了识别的精准度,并且为用户的语音交互提供了安全保障,提升了用户的使用感受。

Signal Processing Method and Terminal Equipment

【技术实现步骤摘要】
信号处理方法及终端设备
本专利技术涉及语音识别
,特别是涉及一种信号处理方法及终端设备。
技术介绍
超声攻击(又名“海豚攻击”)是在2017年ACMCCS(TheACMConferenceonComputerandCommunicationsSecurity,计算机通信与安全)会议上提出的,据称超声攻击能攻破终端的语音助手应用,这让人们对语音交互的安全性产生了质疑。超声攻击就是利用了超声的基本原理,其实现思路是:在攻击信号调制阶段,把处于第一频率范围(正常频率范围)内的攻击语音信号(这里称为基带信号),调制到让用户无法听到的超声范围。然后在攻击信号传输阶段,利用超声发射器来向被测设备(手机、智能家居设备等终端设备)发射调制后的攻击语音信号。在语音信号采集阶段,该攻击语音信号会被被测设备的语音控制系统采集到。语音信号采集阶段中又进一步包含语音信号解调阶段,通过被测设备端语音采集系统的硬件漏洞进行自动解调功能,从而恢复出基带信号,之后解调后的基带信号经过语音信号采集阶段的放大器、低通滤波器以及模数转换器(ADC,Analog-to-DigitalConverter)后,被终端设备的语音控制系统识别并响应,从而实现对设备的控制,具体过程如图1所示。对于说话人识别系统的安全问题,目前的研究仅针对如何区别重放的声音和真实的声音。其解决方案一般是通过提取声音的特征如静音特征,梅尔频率倒谱系数(MFCC,Mel-FrequencyCepstrumCoefficients),然后对该提取的特征进行训练,训练模型如GMM-UBM(GaussianMixtureModel-UniversalBackgroundModel,高斯混合模型-通用背景模型)模型,特征的支持向量机(SVM,SupportVectorMachine)或者K最近邻域分类算法(KNN,k-nearestneighbors),通过使用上述训练好的模型进行分类,来区分重放的声音和真实的声音。上述基于GMM-UBM说话人识别系统如图2所示,该基于SVM区别重放声音和真实声音的系统如图3所述。对于现有技术存在的上述语音安全方面的解决方案,例如说话人识别系统(GMM-UBM),或基于梅尔频率倒谱系数(MFCC)特征的支持向量机(SVM)或者K最近邻域分类算法(KNN),虽然能提供一定的安全保障,但是还存在下述问题:1)现有的基于高斯混合模型的说话人识别系统(GMM-UBM)不能够准确的区别真实语音还是录播的语音,从而无法抵御超声攻击。2)现有的基于高斯混合模型的说话人识别系统(GMM-UBM)仅能在安静的环境下工作,在其他复杂的环境下无法正常工作。3)现有的基于梅尔频率倒谱系数(MFCC)特征的支持向量机(SVM)或者K最近邻域分类算法(KNN)仅能处理使用手机或者笔记本等设备录播的质量较低的攻击语音信息,其无法处理高保真级别的录音攻击。而若用于攻击的语音信息是高保真级别的录音时,便无法进行有效的识别处理。综上可见,现有的语音安全解决方案都不能很好的解决上述超声攻击问题,致使用户的语音交互存在非常大的安全隐患。
技术实现思路
本专利技术提供了一种信号处理方法及终端设备,以实现对非正常语音信号的有效识别,提高识别精准度,并为用户语音交互提供安全保障,从而提升用户的使用感受。该信号处理方法,包括:从输入的信号中提取特征信息;根据提取的特征信息,确定输入的信号是否为非正常语音信号。优选地,所述特征信息包括信号的能量特征和/或信号的周期特征。优选地,所述能量特征包括短时能量特征;和/或,所述周期特征包括短时过零率特征。优选地,根据提取的特征信息,确定输入的信号是否为非正常语音信号,包括:根据提取的特征信息,通过机器学习的方式,确定输入的信号是否为非正常语音信号。优选地,从输入的信号中提取特征信息,包括:从输入的信号的设定频率范围内提取特征信息。优选地,根据提取的特征信息,确定输入的信号是否为非正常语音信号,包括:根据提取的特征信息的变化,确定输入的信号是否为非正常语音信号。优选地,所述特征信息包括信号的能量特征和/或信号的方向特征。优选地,根据提取的特征信息,确定输入的信号是否为非正常语音信号,包括:确定所述特征信息是否与当前的动态唤醒指令对应的唤醒特征信息匹配;若未匹配,则确定所述语音信号为非正常语音信号。优选地,所述特征信息包括梅尔频率倒谱系数MFCC特征和/或动态验证码。优选地,所述特征信息包括语音命令,根据提取的特征信息,确定输入的信号是否为非正常语音信号,包括:确定所述语音命令与当前动态唤醒图像对应的唤醒词内容是否匹配;若未匹配,则确定所述语音信号为非正常语音信号。优选地,所述特征信息包括背景噪声信息;根据提取的特征信息,确定输入的信号是否为非正常语音信号,包括:根据信号的背景噪声信息,确定输入的信号是否为非正常语音信号。优选地,根据信号的背景噪声信息,确定输入的信号是否为非正常语音信号,包括:根据信号的背景噪声确定当前环境信息,根据所述当前环境信息,确定是否为非正常语音信号。优选地,所述特征信息包括声源位置信息;根据提取的特征信息,确定输入的信号是否为非正常语音信号,包括:确定从输入的语音信号提取的声源位置信息是否与检测到的用户嘴部位置信息匹配;若未匹配,则确定所述语音信号为非正常语音信号。优选地,还包括:在预设频率范围内发送非正常语音干扰信号。优选地,所述非正常语音干扰信号包括超声波随机干扰信号。优选地,从输入的信号中提取特征信息之前,还包括:根据采样频率高于设定频率阈值的采样设备,对输入的信号进行采样;对采样后的信号进行低通滤波处理。优选地,还包括:在确定输入的信号为非正常语音信号时,发送相应的提示信息。本专利技术还提供了一种终端设备,包括:处理器;以及存储器,配置用于存储机器可读指令,所述指令在由所述处理器执行时,使得所述处理器执行上述的方法。本专利技术还提供了一种信号处理方法,包括:确定输入的信号对应的控制操作;根据输入的信号对应的控制操作,确定输入的信号是否为非正常语音信号。优选地,根据输入的信号对应的控制操作,确定输入的信号是否为非正常语音信号,包括:确定当前可行的控制操作;若输入的信号对应的控制操作与当前可行的控制操作不匹配,则确定输入的信号为非正常语音信号。本专利技术还提供了一种终端设备,包括:处理器;以及存储器,配置用于存储机器可读指令,所述指令在由所述处理器执行时,使得所述处理器执行上述的方法。本专利技术还提供了一种信号处理方法,包括:接收输入的信号;在预设频率范围内发送非正常语音干扰信号。优选地,所述非正常语音干扰信号包括超声波随机干扰信号。本专利技术还提供了一种终端设备,包括:处理器;以及存储器,配置用于存储机器可读指令,所述指令在由所述处理器执行时,使得所述处理器执行上述的方法。本专利技术还提供了一种信号处理方法,包括:接收输入的信号;根据采样频率高于设定频率阈值的采样设备,对输入的信号进行采样;对采样后的信号进行低通滤波处理。本专利技术还提供了一种终端设备,包括:处理器;以及存储器,配置用于存储机器可读指令,所述指令在由所述处理器执行时,使得所述处理器执行上述的方法。本专利技术中,通过根据输入的信号中提取的特征信息来确定该输入的信号是否为非正常语音信号的本文档来自技高网
...

【技术保护点】
1.一种信号处理方法,其特征在于,包括:从输入的信号中提取特征信息;根据提取的特征信息,确定输入的信号是否为非正常语音信号。

【技术特征摘要】
2017.11.02 CN 20171106607301.一种信号处理方法,其特征在于,包括:从输入的信号中提取特征信息;根据提取的特征信息,确定输入的信号是否为非正常语音信号。2.如权利要求1所述的方法,其特征在于,所述特征信息包括信号的能量特征和/或信号的周期特征。3.如权利要求2所述的方法,其特征在于,所述能量特征包括短时能量特征;和/或,所述周期特征包括短时过零率特征。4.如权利要求2或3所述的方法,其特征在于,根据提取的特征信息,确定输入的信号是否为非正常语音信号,包括:根据提取的特征信息,通过机器学习的方式,确定输入的信号是否为非正常语音信号。5.如权利要求1~4任一项所述的方法,其特征在于,从输入的信号中提取特征信息,包括:从输入的信号的设定频率范围内提取特征信息。6.如权利要求1所述的方法,其特征在于,根据提取的特征信息,确定输入的信号是否为非正常语音信号,包括:根据提取的特征信息的变化,确定输入的信号是否为非正常语音信号。7.如权利要求6所述的方法,其特征在于,所述特征信息包括信号的能量特征和/或信号的方向特征。8.如权利要求1所述的方法,其特征在于,根据提取的特征信息,确定输入的信号是否为非正常语音信号,包括:确定所述特征信息是否与当前的动态唤醒指令对应的唤醒特征信息匹配;若未匹配,则确定所述语音信号为非正常语音信号。9.如权利要求8所述的方法,其特征在于,所述特征信息包括梅尔频率倒谱系数MFCC特征和/或动态验证码。10.如权利要求1所述的方法,其特征在于,所述特征信息包括语音命令,根据提取的特征信息,确定输入的信号是否为非正常语音信号,包括:确定所述语音命令与当前动态唤醒图像对应的唤醒词内容是否匹配;若未匹配,则确定所述语音信号为非正常语音信号。11.如权利要求1所述的方法,其特征在于,所述特征信息包括背景噪声信息;根据提取的特征信息,确定输入的信号是否为非正常语音信号,包括:根据信号的背景噪声信息,确定输入的信号是否为非正常语音信号。12.如权利要求11所述的方法,其特征在于,根据信号的背景噪声信息,确定输入的信号是否为非正常语音信号,包括:根据信号的背景噪声确定当前环境信息,根据所述当前环境信息,确定是否为非正常语音信号。13.如权利要求1所述的方法,其特征在于,所述特征信息包括声源位置信息;...

【专利技术属性】
技术研发人员:王宪亮王立众尹成万朱恒刘长滔闵超杨磊
申请(专利权)人:北京三星通信技术研究有限公司三星电子株式会社
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1