确定自定义唤醒词阈值的方法以及装置、存储介质、电子装置制造方法及图纸

技术编号:35693567 阅读:20 留言:0更新日期:2022-11-23 14:43
本申请公开了一种确定自定义唤醒词阈值的方法以及装置、存储介质、电子装置。该方法包括根据预设声学模型的测试测试集产生的后验结果对用户定义的唤醒参数打分,得到误唤醒指标,其中所述预设声学模型用于将前向计算存储后验;根据所述误唤醒指标,确定自定义唤醒词阈值。本申请通过设置唤醒词阈值,解决了使用自定义唤醒词进行语音唤醒时会发生误唤醒率高的技术问题。高的技术问题。高的技术问题。

【技术实现步骤摘要】
确定自定义唤醒词阈值的方法以及装置、存储介质、电子装置


[0001]本申请涉及语音处理领域,具体而言,涉及一种确定自定义唤醒词阈值的方法以及装置、存储介质、电子装置。

技术介绍

[0002]随着智能电子设备的发展,越来越多的设备开始支持语音控制。而在开发语音唤醒或命令词识别时,由于不同厂家不同设备设置的唤醒词都不一样,对用户的体验不够友好,需要支持用户自定义唤醒词。
[0003]相关技术中,往往基于经验值设置,无法精确控制唤醒/误唤醒性能,导致难以唤醒设备或过高的误唤醒。比如,对于常见的自定义唤醒词效果不错,但是对生僻的唤醒词,可能导致误唤醒比较高或唤醒率比较低。
[0004]针对相关技术中语音唤醒时误唤醒率高的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本申请的主要目的在于提供一种确定自定义唤醒词阈值的方法以及装置、存储介质、电子装置,以解决语音唤醒时误唤醒率高的问题。
[0006]为了实现上述目的,根据本申请的一个方面,提供了一种确定自定义唤醒词阈值的方法,用于用户端。
[0007]根据本申请的确定自定义唤醒词阈值的方法包括:根据预设声学模型的测试测试集产生的后验结果对用户定义的唤醒参数打分,得到误唤醒指标,其中所述预设声学模型用于将前向计算存储后验;根据所述误唤醒指标,确定自定义唤醒词阈值。
[0008]进一步地,方法还包括:将所述所述预设声学模型的测试集产生的后验结果进行结果过滤,通过CTC算法后验输出非空格帧稀疏的特性,采用CTC损失函数训练所述预设声学模型,并通过设置空格阈值将所述空格后验概率超过预设阈值的帧进行过滤,其中所述空格是指所述CTC的空节点。
[0009]进一步地,采用CTC损失函数训练所述预设声学模型,并通过设置空格阈值将所述空格后验概率超过预设阈值的帧进行过滤后压缩所述测试集产生的后验结果。
[0010]进一步地,采用CTC损失函数训练所述预设声学模型将尖峰后验时间序列存储下来,并通过设置空格阈值将所述空格后验概率超过预设空格概率的帧进行过滤。
[0011]进一步地,所述根据所述误唤醒指标,确定自定义唤醒词阈值,包括:所述误唤醒指标至少包括如下之一:自定义唤醒词、误唤醒次数;根据所述误唤醒指标中误唤醒次数,在所述测试集中使用存储的后验结果计算新自定义唤醒词误唤醒次数。
[0012]进一步地,所述根据所述误唤醒指标,确定自定义唤醒词阈值,还包括:根据所述误唤醒指标中的误唤醒次数,筛选所述自定义唤醒词阈值;将所述唤醒词阈值选择成功的消息通知用户。
[0013]为了实现上述目的,根据本申请的一个方面,提供了一种确定自定义唤醒词阈值
的方法,用于服务端。
[0014]根据本申请的确定自定义唤醒词阈值的方法包括:接收预设测试集的音频数据;根据预设声学模型的测试测试集产生的后验结果对用户定义的唤醒参数打分,得到误唤醒指标,其中所述预设声学模型用于将前向计算存储后验;根据所述误唤醒指标,确定自定义唤醒词阈值并下发至所述用户端。
[0015]为了实现上述目的,根据本申请的另一方面,提供了一种确定自定义唤醒词阈值的装置。
[0016]根据本申请的确定自定义唤醒词阈值的装置包括:预处理模块,用于根据预设声学模型的测试测试集产生的后验结果对用户定义的唤醒参数打分,得到误唤醒指标,其中所述预设声学模型用于将前向计算存储后验;计算模块,用于根据所述测试集产生的后验结果对用户定义的唤醒参数打分,得到误唤醒指标;阈值确定模块,用于根据所述误唤醒指标,确定自定义唤醒词阈值。
[0017]为了实现上述目的,根据本申请的另一个方面,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
[0018]为了实现上述目的,根据本申请的再一个方面,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
[0019]在本申请实施例中确定自定义唤醒词阈值的方法以及装置、存储介质、电子装置,根据预设声学模型的测试测试集产生的后验结果对用户定义的唤醒参数打分,得到误唤醒指标,达到了根据所述误唤醒指标,确定自定义唤醒词阈值的目的,从而实现了根据所述误唤醒指标,确定自定义唤醒词阈值的技术效果,进而解决了语音唤醒时误唤醒率高的技术问题。
附图说明
[0020]构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0021]图1是根据本申请实施例的确定自定义唤醒词阈值的方法的硬件结构示意图;
[0022]图2是根据本申请实施例的确定自定义唤醒词阈值的方法的流程示意图;
[0023]图3是根据本申请实施例的确定自定义唤醒词阈值的装置结构示意图;
[0024]图4是根据本申请实施例的确定自定义唤醒词阈值的方法的流程示意图;
[0025]图5是根据本申请实施例的确定自定义唤醒词阈值的方法中用户阈值确定流程示意图;
[0026]图6是根据本申请实施例的确定自定义唤醒词阈值的方法中初始化流程示意图。
具体实施方式
[0027]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是
本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
[0028]需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0029]在本申请中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本申请及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。
[0030]并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种确定自定义唤醒词阈值的方法,其特征在于,用于用户端,所述方法包括:根据预设声学模型的测试测试集产生的后验结果对用户定义的唤醒参数打分,得到误唤醒指标,其中所述预设声学模型用于将前向计算存储后验;根据所述误唤醒指标,确定自定义唤醒词阈值。2.根据权利要求1所述的方法,其特征在于,还包括:将所述所述预设声学模型的测试集产生的后验结果进行结果过滤,通过CTC算法后验输出非空格帧稀疏的特性,采用CTC损失函数训练所述预设声学模型,并通过设置空格阈值将所述空格后验概率超过预设阈值的帧进行过滤,其中所述空格是指所述CTC的空节点。3.根据权利要求2所述的方法,其特征在于,采用CTC损失函数训练所述预设声学模型,并通过设置空格阈值将所述空格后验概率超过预设阈值的帧进行过滤后压缩所述测试集产生的后验结果。4.根据权利要求2所述的方法,其特征在于,采用CTC损失函数训练所述预设声学模型将尖峰后验时间序列存储下来,并通过设置空格阈值将所述空格后验概率超过预设空格概率的帧进行过滤。5.根据权利要求1所述的方法,其特征在于,所述根据所述误唤醒指标,确定自定义唤醒词阈值,包括:所述误唤醒指标至少包括如下之一:自定义唤醒词、误唤醒次数;根据所述误唤醒指标中误唤醒次数,在所述测试集中使用存储的后验结果计算新自定义唤醒词误唤醒次数。6.根据权利要求5...

【专利技术属性】
技术研发人员:张钦司玉景李全忠
申请(专利权)人:普强时代珠海横琴信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1