终端设备唤醒方法和装置、存储介质及电子装置制造方法及图纸

技术编号:30640561 阅读:14 留言:0更新日期:2021-11-04 00:35
本发明专利技术公开了一种终端设备唤醒方法和装置、存储介质及电子装置,其中,上述方法包括:获取待识别的音频数据;在终端设备内配置的至少两个唤醒模型的每个唤醒模型中,基于各自从音频数据中提取的不同维度下的音频特征分别进行唤醒识别,得到与唤醒模型对应的音频识别结果,其中,每个唤醒模型用于提取一种维度下的音频特征;在音频识别结果达到唤醒条件的情况下,将终端设备调整为唤醒状态。采用上述技术方案,解决了现有技术中终端设备的唤醒性能差的问题。差的问题。差的问题。

【技术实现步骤摘要】
终端设备唤醒方法和装置、存储介质及电子装置


[0001]本专利技术涉及语音识别
,具体而言,涉及一种终端设备唤醒方法和装置、存储介质及电子装置。

技术介绍

[0002]在终端设备语音交互领域,终端设备一般处于待机状态,如果需要与终端设备进行交互,第一步是先将终端设备唤醒,目标集成于终端的唤醒算法,当录入噪音或者用户的其他非唤醒语音导致设备误唤醒,给用户的正常生活带来许多不便。
[0003]针对上述问题,现有技术中一般会采用二次校验的方式进行辅助校准,以降低误唤醒,但用于第二次唤醒校验的模型一般都是精度更高的大模型,不好部署于终端,一般都存放于云端,由于网络传输、云端计算等,会增加唤醒响应时间,造成了设备的唤醒性能差的问题。
[0004]针对相关技术,终端设备的唤醒性能差的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种终端设备唤醒方法和装置、存储介质及电子装置,以至少解决在终端设备的唤醒过程中,唤醒性能差的问题。
[0006]根据本专利技术实施例的一方面,提供一种终端设备唤醒方法,包括:获取待识别的音频数据;在终端设备内配置的至少两个唤醒模型的每个唤醒模型中,基于各自从音频数据中提取的不同维度下的音频特征分别进行唤醒识别,得到与唤醒模型对应的音频识别结果,其中,每个唤醒模型用于提取一种维度下的音频特征;在音频识别结果达到唤醒条件的情况下,将终端设备调整为唤醒状态。
[0007]可选地,上述在终端设备内配置的至少两个唤醒模型的每个唤醒模型中,基于各自从音频数据中提取的不同维度下的音频特征分别进行唤醒识别,得到与唤醒模型对应的音频识别结果之后,还包括:在用于指示上述音频数据中携带有唤醒信息的音频识别结果的数量大于第一阈值的情况下,确定上述音频识别结果达到唤醒条件。
[0008]可选地,上述在终端设备内配置的至少两个唤醒模型的每个唤醒模型中,基于各自从音频数据中提取的不同维度下的音频特征分别进行唤醒识别,得到与唤醒模型对应的音频识别结果包括:将上述至少两个唤醒模型中的每个唤醒模型分别作为当前唤醒模型,并执行以下操作:在上述当前唤醒模型中提取上述音频数据在当前维度下的音频特征;对上述当前维度下的音频特征进行唤醒识别;在从上述当前维度下的音频特征中识别出唤醒关键词的情况下,确定上述音频识别结果中携带有上述唤醒信息。
[0009]可选地,上述在终端设备内配置的至少两个唤醒模型的每个唤醒模型中,基于各自从音频数据中提取的不同维度下的音频特征分别进行唤醒识别,得到与唤醒模型对应的音频识别结果之后,还包括:将上述音频数据依次输入上述至少两个唤醒模型的每个唤醒模型中,得到上述音频识别结果,其中,在上述至少两个唤醒模型中相邻的两个唤醒模型
中,第一唤醒模型的输出结果与上述音频数据将同时输入第二唤醒模型中,上述第一唤醒模型位于上述第二唤醒模型之前。
[0010]可选地,上述在终端设备内配置的至少两个唤醒模型的每个唤醒模型中,基于各自从音频数据中提取的不同维度下的音频特征分别进行唤醒识别,得到与唤醒模型对应的音频识别结果包括:在最后一个唤醒模型的输出结果指示上述音频数据中携带有唤醒关键词的情况下,确定上述音频识别结果达到上述唤醒条件。
[0011]可选地,在上述获取待识别的音频数据之前,还包括:获取多个样本音频数据;利用上述多个样本音频数据对至少两个初始化唤醒模型进行训练,以得到上述至少两个唤醒模型。
[0012]可选地,上述利用上述多个样本音频数据对至少两个初始化唤醒模型进行训练,以得到上述至少两个唤醒模型包括:遍历至少两个初始化唤醒模型执行以下操作,直至达到收敛条件:确定待训练的当前初始化唤醒模型;在上述当前初始化唤醒模型并非首个初始化唤醒模型的情况下,获取在上述当前初始化唤醒模型之前的上一个初始化唤醒模型训练后得到的参考训练结果;利用参考训练结果及多个样本音频数据,对当前初始化唤醒模型进行训练,得到当前训练结果;在上述当前初始化唤醒模型为首个初始化唤醒模型的情况下,利用上述多个样本音频数据对上述当前初始化唤醒模型进行训练,得到当前训练结果;在上述当前训练结果并未达到上述收敛条件的情况下,将在上述当前初始化唤醒模型之后的下一个初始化唤醒模型,确定为上述当前初始化唤醒模型。
[0013]可选地,上述利用上述多个样本音频数据对至少两个初始化唤醒模型进行训练,以得到上述至少两个唤醒模型包括:在上述至少两个初始化唤醒模型包括两个初始化唤醒模型的情况下,将上述多个样本音频数据中的部分音频数据作为训练集输入第一初始化唤醒模型进行训练,并将上述多个样本音频数据中的剩余音频数据作为测试集输入上述第一初始化唤醒模型进行预测,得到预测结果;将上述第一初始化唤醒模型的预测结果及上述多个样本音频数据进行拼接,得到拼接数据;将上述拼接数据输入第二初始化唤醒模型进行训练,直至达到收敛条件,其中,在达到上述收敛条件时,得到上述至少两个唤醒模型。
[0014]根据本专利技术实施例的另一方面,提供一种终端设备唤醒装置,包括:获取单元,用于获取待识别的音频数据;提取单元,用于在终端设备内配置的至少两个唤醒模型的每个唤醒模型中,基于各自从上述音频数据中提取的不同维度下的音频特征分别进行唤醒识别,得到与上述唤醒模型对应的音频识别结果,其中,每个唤醒模型用于提取一种维度下的音频特征;调整单元,用于在上述音频识别结果达到唤醒条件的情况下,将上述终端设备调整为唤醒状态。
[0015]根据本专利技术实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行广告展示方法。
[0016]根据本专利技术实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述广告展示方法。
[0017]通过本专利技术实施例,获取待识别的音频数据;在终端设备内配置的至少两个唤醒模型的每个唤醒模型中,基于各自从音频数据中提取的不同维度下的音频特征分别进行唤
醒识别,得到与唤醒模型对应的音频识别结果,其中,每个唤醒模型用于提取一种维度下的音频特征;在音频识别结果达到唤醒条件的情况下,将终端设备调整为唤醒状态。也就是说,通过在终端设备部署至少两个唤醒模型,分别提取不同维度下的音频特征,进而得到每个唤醒模型对应的音频识别结果。然后基于得到的音频识别结果判断是否达到终端设备的唤醒条件,在达到唤醒条件的情况下,将终端设备的状态调整为唤醒状态。也即通过上述至少一个唤醒模型,对音频数据进行不同维度下的特征提取及音频识别,解决了单一模型进行唤醒识别过程中出现的唤醒性能差的问题。进而提升了音频识别结果的可靠性,提高了终端设备的唤醒性能。
附图说明
[0018]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示例性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0019]图1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种终端设备唤醒方法,其特征在于,包括:获取待识别的音频数据;在终端设备内配置的至少两个唤醒模型的每个唤醒模型中,基于各自从所述音频数据中提取的不同维度下的音频特征分别进行唤醒识别,得到与所述唤醒模型对应的音频识别结果,其中,每个唤醒模型用于提取一种维度下的音频特征;在所述音频识别结果达到唤醒条件的情况下,将所述终端设备调整为唤醒状态。2.根据权利要求1所述的方法,其特征在于,在终端设备内配置的至少两个唤醒模型的每个唤醒模型中,基于各自从所述音频数据中提取的不同维度下的音频特征分别进行唤醒识别,得到与所述唤醒模型对应的音频识别结果之后,还包括:在用于指示所述音频数据中携带有唤醒信息的所述音频识别结果的数量大于第一阈值的情况下,确定所述音频识别结果达到所述唤醒条件。3.根据权利要求2所述的方法,其特征在于,在终端设备内配置的至少两个唤醒模型的每个唤醒模型中,基于各自从所述音频数据中提取的不同维度下的音频特征分别进行唤醒识别,得到与所述唤醒模型对应的音频识别结果包括:将所述至少两个唤醒模型中的每个唤醒模型分别作为当前唤醒模型,并执行以下操作:在所述当前唤醒模型中提取所述音频数据在当前维度下的音频特征;对所述当前维度下的音频特征进行唤醒识别;在从所述当前维度下的音频特征中识别出唤醒关键词的情况下,确定所述音频识别结果中携带有所述唤醒信息。4.根据权利要求1所述的方法,其特征在于,在终端设备内配置的至少两个唤醒模型的每个唤醒模型中,基于各自从所述音频数据中提取的不同维度下的音频特征分别进行唤醒识别,得到与所述唤醒模型对应的音频识别结果之后,还包括:将所述音频数据依次输入所述至少两个唤醒模型的每个唤醒模型中,得到所述音频识别结果,其中,在所述至少两个唤醒模型中相邻的两个唤醒模型中,第一唤醒模型的输出结果与所述音频数据将同时输入第二唤醒模型中,所述第一唤醒模型位于所述第二唤醒模型之前。5.根据权利要求4所述的方法,其特征在于,在终端设备内配置的至少两个唤醒模型的每个唤醒模型中,基于各自从所述音频数据中提取的不同维度下的音频特征分别进行唤醒识别,得到与所述唤醒模型对应的音频识别结果包括:在最后一个唤醒模型的输出结果指示所述音频数据中携带有唤醒关键词的情况下,确定所述音频识别结果达到所述唤醒条件。6.根据权利要求1所述的方法,其特征在于,在所述获取待识别的音频数据之前,还包括:获取多个样本音频数据;利用所述多个样本音频数据对至少两个初...

【专利技术属性】
技术研发人员:葛路奇张卓博朱文博
申请(专利权)人:海尔智家股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1