语音唤醒方法和装置、计算机可读存储介质、电子设备制造方法及图纸

技术编号:29088299 阅读:33 留言:0更新日期:2021-06-30 09:53
本公开实施例公开了一种语音唤醒方法和装置、计算机可读存储介质、电子设备,其中,方法包括:获取语音信号,确定所述语音信号包括的多帧信号中每帧信号为至少一个音素的概率值;其中,每帧所述信号对应至少一个音素,每个所述音素对应一个概率值;基于所述每个音素对应的概率值,确定所述语音信号对应的第一路径;根据所述第一路径中包括的多个音素与先验条件,确定所述第一路径是否满足预设条件;若所述第一路径满足预设条件,根据所述语音信号对待唤醒设备进行唤醒;本公开实施例结合先验条件对第一路径进行判断,增加了判断策略来确定是否误报,在提升关键词的识别率的同时能够降低语音信号的误报率。降低语音信号的误报率。降低语音信号的误报率。

【技术实现步骤摘要】
语音唤醒方法和装置、计算机可读存储介质、电子设备


[0001]本公开涉及语音唤醒
,尤其是一种语音唤醒方法和装置、计算机可读存储介质、电子设备。

技术介绍

[0002]设备(手机、玩具、家电等)在休眠或锁屏状态下,根据检测到用户的声音(设定的语音指令,即关键词),使处于休眠状态下的设备直接进入到等待指令状态,开启语音交互第一步。
[0003]在关键词唤醒的场景中,识别率和误报率互相矛盾的,如果把识别率调整到比较高的水平,误报率也比较高。

技术实现思路

[0004]为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种语音唤醒方法和装置、计算机可读存储介质、电子设备。
[0005]根据本公开实施例的一个方面,提供了一种语音唤醒方法,包括:
[0006]获取语音信号,确定所述语音信号包括的多帧信号中每帧信号为至少一个音素的概率值;其中,每帧所述信号对应至少一个音素,每个所述音素对应一个概率值;
[0007]基于所述每个音素对应的概率值,确定所述语音信号对应的第一路径;
[0008]根据所述第一路径中包括的多个音素与先验条件,确定所述第一路径是否满足预设条件;
[0009]若所述第一路径满足预设条件,根据所述语音信号对待唤醒设备进行唤醒。
[0010]根据本公开实施例的另一方面,提供了一种语音唤醒装置,包括:
[0011]概率值确定模块,用于获取语音信号,确定所述语音信号包括的多帧信号中每帧信号为至少一个音素的概率值;其中,每帧所述信号对应至少一个音素,每个所述音素对应一个概率值;
[0012]路径确定模块,用于基于所述概率值确定模块确定的每个音素对应的概率值,确定所述语音信号对应的第一路径;
[0013]条件确定模块,用于根据所述路径确定模块确定的第一路径中包括的多个音素与先验条件,确定所述第一路径是否满足预设条件;
[0014]唤醒确定模块,用于若所述条件确定模块确定的第一路径满足预设条件,根据所述语音信号对待唤醒设备进行唤醒。
[0015]根据本公开实施例的又一方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述任一实施例所述的语音唤醒方法。
[0016]根据本公开实施例的还一方面,提供了一种电子设备,所述电子设备包括:
[0017]处理器;
[0018]用于存储所述处理器可执行指令的存储器;
[0019]所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述任一实施例所述的语音唤醒方法。
[0020]基于本公开上述实施例提供的一种语音唤醒方法和装置、计算机可读存储介质、电子设备,获取语音信号,确定所述语音信号包括的多帧信号中每帧信号为至少一个音素的概率值;其中,每帧所述信号对应至少一个音素,每个所述音素对应一个概率值;基于所述每个音素对应的概率值,确定所述语音信号对应的第一路径;根据所述第一路径中包括的多个音素与先验条件,确定所述第一路径是否满足预设条件;若所述第一路径满足预设条件,根据所述语音信号对待唤醒设备进行唤醒;本公开实施例结合先验条件对第一路径进行判断,增加了判断策略来确定是否误报,在提升关键词的识别率的同时能够降低语音信号的误报率。
[0021]下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
[0022]通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
[0023]图1是本公开一示例性实施例提供的语音唤醒方法的流程示意图。
[0024]图2是本公开另一示例性实施例提供的语音唤醒方法的流程示意图。
[0025]图3是本公开又一示例性实施例提供的语音唤醒方法的流程示意图。
[0026]图4是本公开图2所示的实施例中步骤201的一个流程示意图。
[0027]图5是本公开图2所示的实施例中步骤202的一个流程示意图。
[0028]图6是本公开一示例性实施例提供的语音唤醒装置的结构示意图。
[0029]图7是本公开另一示例性实施例提供的语音唤醒装置的结构示意图。
[0030]图8是本公开一示例性实施例提供的电子设备的结构图。
具体实施方式
[0031]下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。
[0032]应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
[0033]本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
[0034]还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
[0035]还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
[0036]另外,本公开中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0037]还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
[0038]同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
[0039]以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
[0040]对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
[0041]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
[0042]本公开实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端设备、计算机系统、服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音唤醒方法,包括:获取语音信号,确定所述语音信号包括的多帧信号中每帧信号为至少一个音素的概率值;其中,每帧所述信号对应至少一个音素,每个所述音素对应一个概率值;基于所述每个音素对应的概率值,确定所述语音信号对应的第一路径;根据所述第一路径中包括的多个音素与先验条件,确定所述第一路径是否满足预设条件;若所述第一路径满足预设条件,根据所述语音信号对待唤醒设备进行唤醒。2.根据权利要求1所述的方法,其中,所述根据所述第一路径中包括的多个音素与先验条件,确定所述第一路径是否满足预设条件,包括:若所述第一路径中包括的多个音素符合所述先验条件,确定所述第一路径满足预设条件。3.根据权利要求2所述的方法,其中,所述先验条件包括:所述第一路径中包括的多个音素中错误音素的数量小于预设比例;其中,所述错误音素包括以下至少一种:对应的概率值小于预设概率的音素,持续帧数小于预设帧数的音素。4.根据权利要求1

3任一所述的方法,所述根据所述第一路径中包括的多个音素与先验条件,确定所述第一路径是否满足预设条件之前,还包括:基于历史语音信号集确定所述先验条件;其中,所述历史语音信号集中包括多个历史语音信号,每个所述历史语音信号已知唤醒结果,所述唤醒结果表示可以唤醒所述待唤醒设备或不可唤醒所述待唤醒设备。5.根据权利要求4所述的方法,其中,所述基于历史语音数据集确定所述先验条件,包括:对所述历史语音信号集中的多个历史语音信号分别进行处理,分别确定所述多个历史语音信号中每个所述历史语音信号对应的历史第一路径;根据每个所述历史语音信号对应的唤醒结果,确定所述先验条件。6.根据权利要求1所述的方法,其中,所述获取语音信号,确定所述语音信号包括的多帧信号中每帧信...

【专利技术属性】
技术研发人员:黄明运
申请(专利权)人:南京地平线机器人技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1