一种系统唤醒方法及装置制造方法及图纸

技术编号:24253136 阅读:44 留言:0更新日期:2020-05-23 00:25
本发明专利技术实施例提供了一种系统唤醒方法及装置,所述方法应用于人工智能系统,所述方法包括:当所述人工智能系统处于休眠模式时接收语音信息,并对所述语音信息进行预处理,得到处理语音信息;获取所述处理语音信息的声学特征;确定所述声学特征与预存数据库的特征是否相同;若所述声学特征与预存数据库的声学特征相同,则判断所述处理语音信息是否包含唤醒信息;若所述处理语音信息包含唤醒信息,则执行唤醒操作。本实施例提出的系统唤醒方法,操作简便,可以从语音数据中提取出不同的声学特征,并利用不同的声学特征快速识别唤醒字词,可以提高识别准确率,而且可以降低误识别的概率,也提高了人工智能系统识别的准确度,提高用户的使用体验。

A system wake-up method and device

【技术实现步骤摘要】
一种系统唤醒方法及装置
本专利技术涉及互联网
,特别是涉及一种系统唤醒方法以及一种系统唤醒装置。
技术介绍
随着互联网的不断普及,人工智能系统也逐渐进入人们的生活一部分,为人们生活提供便利。人工智能系统可以通过识别用户的语音数据,从而执行语音数据对应的操作,为用户的生活提供便利。在唤醒人工智能系统时,用户的语音数据容易受到环境的语音数据影响,例如在用户旁边有其他朋友在,使得用户的语音数据与朋友的语音数据相互混淆,使得人工智能系统无法识别用户的唤醒操作。
技术实现思路
鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种系统唤醒方法以及一种系统唤醒装置。为了解决上述问题,本专利技术实施例公开了一种系统唤醒方法,应用于人工智能系统,所述方法包括:当所述人工智能系统处于休眠模式时接收语音信息,并对所述语音信息进行预处理,得到处理语音信息;获取所述处理语音信息的声学特征;确定所述声学特征与预存数据库的特征是否相同;若所述声学特征与预存数据库的声学特征相同,则判断所述处理语音信息是否包含唤醒信息;若所述处理语音信息包含唤醒信息,则执行唤醒操作。可选地,所述声学特征包括:时间长度、共振峰和基频;所述获取所述处理语音信息的声学特征,包括:获取所述处理语音信息的时间长度;判断所述时间长度是否大于预设时间长度;当所述时间长度大于预测时间长度时,则获取所述处理语音信息的共振峰与基频。可选地,所述唤醒信息包括唤醒字词和语音间隙,所述判断所述处理语音信息是否包含唤醒信息,包括:识别所述语音信息的语音字词;判断所述语音字词是否包含多个唤醒字词;若所述语音字词包含多个唤醒字词,则判断所述多个唤醒字词相互之间是否存在语音间隙;所述若所述处理语音信息包含唤醒信息,则执行唤醒操作,包括:若所述多个唤醒字词相互之间不存在语音间隙,则确定所述处理语音信息包含唤醒信息,并执行唤醒操作。可选地,所述对所述语音信息进行预处理,包括:对所述语音信息进行高通滤波,得到滤波信息;对所述滤波信息进行噪声抑制,得到抑制信息;对所述抑制信息进行自动增益处理,得到处理语音信息。本专利技术实施例还公开了一种系统唤醒装置,应用于人工智能系统,所述装置包括:预处理模块,用于当所述人工智能系统处于休眠模式时接收语音信息,并对所述语音信息进行预处理,得到处理语音信息;获取模块,用于获取所述处理语音信息的声学特征;确定模块,用于确定所述声学特征与预存数据库的特征是否相同;判断模块,用于若所述声学特征与预存数据库的特征相同,则判断所述处理语音信息是否包含唤醒信息;执行模块,用于若所述处理语音信息包含唤醒信息,则执行唤醒操作。可选地,所述声学特征包括:时间长度、共振峰和基频;所述获取模块,包括:获取时间模块,用于获取所述处理语音信息的时间长度;判断时间模块,用于判断所述时间长度是否大于预设时间长度;获取信息模块,用于若所述时间长度大于预测时间长度,则获取所述处理语音信息的共振峰与基频。可选地,所述唤醒信息包括唤醒字词和语音间隙,所述判断模块包括:识别模块,用于识别所述语音信息的语音字词;判断字词模块,用于判断所述语音字词是否包含多个唤醒字词;判断空格模块,用于若所述语音字词包含多个唤醒字词,则判断所述多个唤醒字词相互之间是否存在语音间隙;所述执行模块,包括:唤醒操作模块,用于若所述多个唤醒字词相互之间不存在语音间隙,则确定所述处理语音信息包含唤醒信息,并执行唤醒操作。可选地,所述预处理模块,包括:滤波模块,用于对所述语音信息进行高通滤波,得到滤波信息;抑制模块,用于对所述滤波信息进行噪声抑制,得到抑制信息;增益模块,用于对所述抑制信息进行自动增益处理,得到处理语音信息。本专利技术实施例还公开了一种装置,包括:一个或多个处理器;和其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述装置执行如上述实施例所述的一个或多个方法。本专利技术实施例还公开了一种计算机可读存储介质,其存储的计算机程序使得处理器执行如上述实施例所述的任一项所述方法。本专利技术实施例包括以下优点:提出了一种系统唤醒方法,该方法可以当所述人工智能系统处于休眠模式时接收语音信息,并对所述语音信息进行预处理,得到处理语音信息;获取所述处理语音信息的声学特征;确定所述声学特征与预存数据库的特征是否相同;若所述声学特征与预存数据库的声学特征相同,则判断所述处理语音信息是否包含唤醒信息;最后若所述处理语音信息包含唤醒信息,则执行唤醒操作。本实施例提出的系统唤醒方法,操作简便,可以从语音数据中提取出不同的声学特征,并利用不同的声学特征快速识别唤醒字词,可以提高识别准确率,同时在识别过程中的计算量小,也降低了系统功耗,而且可以降低误识别的概率,也提高了人工智能系统识别的准确度,提高用户的使用体验。附图说明图1是本专利技术的系统唤醒方法实施例一的步骤流程图;图2是本专利技术的系统唤醒方法实施例二的步骤流程图;图3是本专利技术的系统唤醒装置实施例一的结构示意图。具体实施方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。参照图1,示出了本专利技术的系统唤醒方法实施例一的步骤流程图,在本实施例中,该方法可以应用于人工智能系统,该人工智能系统可以是利用人工智能技术或知识工程技术而开发的应用系统、或者基于知识的软件工程辅助系统、或者通过集成操作系统和人工智能与认知科学而进行研究的智能操作系统,又或者是移动终端、计算机终端或者类似的运算装置等等。在具体实现中,该人工智能系统可以是语音智能系统。该语音智能系统可以包括用于接收语音数据的语音接收设备、识别语音数据的识别设备、红外传感器、热源探测器、一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)以及用于存储数据的存储器。其中,存储器可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本专利技术实施例中的报文接收方法对应的计算机程序,处理器通过运行存储在存储器内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。在本实施例中,该方法可以包括:步骤101,当所述人工智能系统处于休眠模式时接收语音信息,并对所述语音信息进行预处理,得本文档来自技高网...

【技术保护点】
1.一种系统唤醒方法,其特征在于,应用于人工智能系统,所述方法包括:/n当所述人工智能系统处于休眠模式时接收语音信息,并对所述语音信息进行预处理,得到处理语音信息;/n获取所述处理语音信息的声学特征;/n确定所述声学特征与预存数据库的特征是否相同;/n若所述声学特征与预存数据库的声学特征相同,则判断所述处理语音信息是否包含唤醒信息;/n若所述处理语音信息包含唤醒信息,则执行唤醒操作。/n

【技术特征摘要】
1.一种系统唤醒方法,其特征在于,应用于人工智能系统,所述方法包括:
当所述人工智能系统处于休眠模式时接收语音信息,并对所述语音信息进行预处理,得到处理语音信息;
获取所述处理语音信息的声学特征;
确定所述声学特征与预存数据库的特征是否相同;
若所述声学特征与预存数据库的声学特征相同,则判断所述处理语音信息是否包含唤醒信息;
若所述处理语音信息包含唤醒信息,则执行唤醒操作。


2.根据权利要求1所述的方法,其特征在于,所述声学特征包括:时间长度、共振峰和基频;所述获取所述处理语音信息的声学特征,包括:
获取所述处理语音信息的时间长度;
判断所述时间长度是否大于预设时间长度;
当所述时间长度大于预测时间长度时,则获取所述处理语音信息的共振峰与基频。


3.根据权利要求1所述的方法,其特征在于,所述唤醒信息包括唤醒字词和语音间隙,所述判断所述处理语音信息是否包含唤醒信息,包括:
识别所述语音信息的语音字词;
判断所述语音字词是否包含多个唤醒字词;
若所述语音字词包含多个唤醒字词,则判断所述多个唤醒字词相互之间是否存在语音间隙;
所述若所述处理语音信息包含唤醒信息,则执行唤醒操作,包括:
若所述多个唤醒字词相互之间不存在语音间隙,则确定所述处理语音信息包含唤醒信息,并执行唤醒操作。


4.根据权利要求1所述的方法,其特征在于,所述对所述语音信息进行预处理,包括:
对所述语音信息进行高通滤波,得到滤波信息;
对所述滤波信息进行噪声抑制,得到抑制信息;
对所述抑制信息进行自动增益处理,得到处理语音信息。


5.一种系统唤醒装置,其特征在于,应用于人工智能系统,所述装置包括:
预处理模块,用于当所述人工智能系统处于休眠模式时接收语音信息,并对所述语音信息进行预处理,得到处理语音信息;
获取模块,用于获取所述处理语音信...

【专利技术属性】
技术研发人员:梁飞宇
申请(专利权)人:深圳市瑞讯云技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1