【技术实现步骤摘要】
电子设备唤醒方法、装置、电子设备及存储介质
本专利技术涉及语音识别技术,尤其涉及电子设备唤醒方法、装置、电子设备及存储介质。
技术介绍
语音技术(SpeechTechnology)的关键技术有自动语音识别技术(ASRAutomaticSpeechRecognition)和文字语音转换技术(TTSTest-to-speech)以及声纹识别技术。让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为最为便捷的人机交互方式之一。将语音技术应用于电子设备,实现唤醒电子设备的功能,即语音唤醒技术。通常语音唤醒(KWSKeyWordSpotting)是通过设定一个固定的唤醒词,在用户说出唤醒词之后,终端上的语音识别功能,才会处于工作状态,否则处于休眠状态。
技术实现思路
有鉴于此,本专利技术实施例提供一种电子设备唤醒方法、装置、电子设备及存储介质,能够实现在满足用户对唤醒词自定义的需求时,有效地降低计算复杂度提升响应速度,提升电子设备的唤醒性能,扩大了唤醒方案的适用场景,提升声音处理模型的鲁棒性和泛 ...
【技术保护点】
1.一种电子设备唤醒方法,其特征在于,所述方法包括:/n获取测试语音集合,并通过声音处理模型中的第一神经网络提取对应的测试语音特征集合;/n通过所述声音处理模型中的第一神经网络,基于所述测试语音特征集合,确定相应的测试特征;/n获取唤醒语音特征集合,并通过声音处理模型中的第一神经网络提取对应的唤醒词特征;/n根据所述测试特征和所述唤醒词特征,通过所述声音处理模型中的第二神经网络进行唤醒判决,以实现基于所述唤醒判决的结果,通过电子设备执行与所述唤醒语音特征相匹配的任务。/n
【技术特征摘要】
1.一种电子设备唤醒方法,其特征在于,所述方法包括:
获取测试语音集合,并通过声音处理模型中的第一神经网络提取对应的测试语音特征集合;
通过所述声音处理模型中的第一神经网络,基于所述测试语音特征集合,确定相应的测试特征;
获取唤醒语音特征集合,并通过声音处理模型中的第一神经网络提取对应的唤醒词特征;
根据所述测试特征和所述唤醒词特征,通过所述声音处理模型中的第二神经网络进行唤醒判决,以实现基于所述唤醒判决的结果,通过电子设备执行与所述唤醒语音特征相匹配的任务。
2.根据权利要求1所述的方法,其特征在于,所述通过所述声音处理模型中的第一神经网络,基于所述测试语音特征集合,确定相应的测试特征,包括:
将所述测试语音特征集合输入所述第一神经网络的声学模型网络;
当所述第一神经网络的关键词隐马尔科夫网络确定对应的置信度大于置信度阈值时,确定所述声学模型网络的隐藏输出层的输出特征为相应的测试特征。
3.根据权利要求1所述的方法,其特征在于,所述获取唤醒语音特征集合,并通过声音处理模型中的第一神经网络提取对应的唤醒词特征,包括:
通过文字语音转换服务器对唤醒词文本进行转换,获取对应的唤醒语音特征集合;
通过所述第一神经网络对所述唤醒语音特征集合进行处理,确定与所述测试特征帧数相同的特征向量,并对所述特征向量进行平均处理,以提取对应的唤醒词特征。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
通过所述文字语音转换服务器,根据发音词典将所述唤醒词文本所包含的每个字符转换成音节标识;
构建所述音节标识与所述唤醒词文本所包含的字符之间的映射关系集合,形成不同的音节组合序列,作为所述唤醒语音特征集合中的元素。
5.根据权利要求1所述的方法,其特征在于,所述根据所述测试特征和所述唤醒词特征,通过所述声音处理模型中的第二神经网络进行唤醒判决,包括:
确定所述测试特征和所述唤醒词特征的余弦相似度;
基于所述测试特征和所述唤醒词特征的余弦相似度,确定对应的余弦相似度矩阵;
通过所述声音处理模型中的第二神经网络,对所述余弦相似度矩阵进行处理,确定对应的判决结果累计值;
基于所述判决结果累计值与所述累计值阈值的比较结果,确定唤醒判决的结果。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取第一训练样本集合,其中所述第一训练样本集合为基础语音训练样本;
对所述第一训练样本集合进行噪声添加处理,以形成相应的第二训练样本集合,其中,所述第二训练样本集合包括正例训练样本和负例训练样本;
通过所述第一训练样本集合对所述声音处理模型中的第一神经网络进行训练,以确定所述第一神经网络的模型参数;
通过所述第二训练样本集合对所述声音处理模型中的第二神经网络进行训练,以确定所述第二神经网络的模型参数。
7.根据权利要求6所述的方法,其特征在于,所述对所述第一训练样本集合进行噪声添加处理,以形成相应的第二训练样本集合,包括:
确定与所述声音处理模型的使用环境相匹配的动态噪声阈值;
根据所述动态噪声阈值对所述第一训练样本集合进行噪声添加处理,以形成与所述动态噪声阈值相匹配的第二训练样本集合。
8.根据权利要求6所述的方法,其特征在于,所述对所述第一训练样本集合进行噪声添加处理,以形成相应的第二训练样本集合,包括:
确定与所述声音处理模型相对应的固定噪声阈值;
根据...
【专利技术属性】
技术研发人员:陈杰,苏丹,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。