【技术实现步骤摘要】
基于多级触发机制的超低功耗唤醒方法及装置
[0001]本专利技术属于语音识别
,具体涉及一种基于多级触发机制的超低功耗唤醒方法及装置。
技术介绍
[0002]随着语音识别技术的飞速发展,语音交互的应用场景越来越普遍,智能车载,智能家居,智能机器人都已是语音交互应用的主要应用场景,用户对便携式设备语音唤醒的需求也更旺盛,便携式设备对语音交互低功耗、低延时、高性能的需求相对主流设备更高。
[0003]相关技术中,多级低功耗语音唤醒技术方案,通常使用的是二级唤醒。通过麦克风阵列收音,做相应的信号处理后(信号增强,噪声抑制,回声消除),然后做第一级语音识别,判断用户是否说出唤醒词,如果确定说出,则开始进行第二级语音识别判断用户是否说出唤醒词。但是这种方式具有以下问题:
[0004]由于要保证远场语音唤醒性能,信号处理功耗大,而且为了降低功耗,各级唤醒不同计算力需求需要配备不同计算力的芯片,存在操作繁琐,且成本较高的问题。
技术实现思路
[0005]有鉴于此,本专利技术的目的在于克服现有技术的不足 ...
【技术保护点】
【技术特征摘要】
1.一种基于多级触发机制的超低功耗唤醒方法,其特征在于,包括:获取语音数据,根据所述语音数据确定待处理语音;将所述待处理语音输入到活动语音检测模型中,确定所述待处理语音为活动语音片段的概率,并将所述概率与第一预设阈值进行对比并在所述概率大于所述预设阈值时,将所述活动语音片段的语音信号输入到第一声学模型中;通过所述第一声学模型确定输入的语音信号与预设语音信号之间的第一相似度并将所述第一相似度与第二预设阈值进行对比,在所述第一相似度大于所述第二预设阈值时,将所述活动语音片段的语音信号输入到第二声学模型中;通过所述第二声学模型确定输入的语音信号与预设语音信息之间的第二相似度并将所述第二相似度与第三预设阈值进行对比,根据对比结果进行命令词识别处理;其中,第二声学模型的识别准确度高于第一声学模型的准确度。2.根据权利要求1所述的方法,其特征在于,所述根据所述语音数据确定待处理语音,包括:对所述语音数据进行降噪、增强处理;将降噪、增强处理后得到的语音数据确定为待处理语音。3.根据权利要求1或2所述的方法,其特征在于,如果所述第一相似度小于等于第二预设阈值,则判断所述第一声学模型运行时间是否超过第一预设值,若运行时间超过第一预设值则结束第一声学模型的运行。4.根据权利要求3所述的方法,其特征在于,所述第一声学模型在接收到活动语音检测模型输出的语音信号时开启,并在确定输出活动语音片段到第二声学模型或运行时间超过第一预设值时关闭;所述第二声学模型在接收到第一声学模型输出的语音信号时开启,并在确定输出命令词唤醒或运行时间超过第二预设值时关闭。5.根据权利要求4所述的方法,其特征在于,所述第一预设值小于第二预设值。6.根据权利要求1所述的方法,其特征在于,所...
【专利技术属性】
技术研发人员:张钦,司玉景,李全忠,何国涛,蒲瑶,
申请(专利权)人:普强时代珠海横琴信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。