【技术实现步骤摘要】
设备自学习方法、设备及介质
[0001]本申请涉及一种设备自学习方法、设备及介质,属于语音识别
技术介绍
[0002]越来越多的电子设备都增加了语音控制功能,比如智能手环、电视机、空调、和智能手机等。因此电子设备通常具有音频采集组件,以获取用户的语音数据,并根据预先训练好的识别模型识别语音数据得到对应的识别词,在识别词与预先存储在电子设备中的识别列表相匹配的情况下,电子设备执行识别词对应的设备功能。
[0003]在传统的设备自学习方法中,用户向识别列表中添加自定义的识别词时,需要获取识别词对应的音频训练集,通过音频训练集重新训练识别模型,训练后的识别模型才能够识别用户自定义的识别词并执行该自定义识别词对应的设备功能。
[0004]由于每添加一次自定义识别词就需要重新训练一次识别模型,而每次训练都需要耗费较多训练资源,且模型训练耗费时间也较长,因此在向电子设备添加自定义识别词时,会导致电子设备响应速度较慢、效率过低的问题,影响用户的体验。
技术实现思路
[0005]本申请提 ...
【技术保护点】
【技术特征摘要】
1.一种设备自学习方法,其特征在于,所述方法包括:获取用于触发同一设备功能的n个相同的语音指令,每个语音指令包括至少一个语音帧;所述n为正整数;对于每个语音指令中的每个语音帧,确定预设音素序列的每个音素在所述语音帧中的后验概率;所述预设音素序列是预定义的常用词的音素序列;确定后验概率排序为前m的音素,得到所述语音帧的候选音素;所述m为正整数;对于不同语音指令中帧时序相同的语音帧,根据所述帧时序相同的语音帧对应的n
×
m个候选音素,确定x个音素,得到目标音素集;所述x为正整数;从各个帧时序对应的目标音素集中,确定所述语音指令对应的最优音素组合,以基于所述最优音素组合触发所述设备功能。2.根据权利要求1所述的方法,其特征在于,所述从各个帧时序对应的目标音素集中,确定所述语音指令对应的最优音素组合,包括:从各个帧时序对应的目标音素集中分别提取一个音素,得到音素组合;在所述音素组合中,若帧时序相邻的至少两个音素相同,则将所述至少两个音素合并为同一音素;对执行合并操作后的各个所述音素组合进行打分,将打分最高的值确定最优音素组合。3.根据权利要求2所述的方法,其特征在于,所述对执行合并操作后的各个所述音素组合进行打分,将打分最高的值确定最优音素组合,还包括:获取预设的声韵母发音规则;使用所述声韵母发音规则对所述音素组合中的各个音素进行删除。4.根据权利要求1所述的方法,其特征在于,所述对于不同语音指令中帧时序相同的语音帧,根据所述帧时序相同的语音帧对应的n
×
m个候选音素,确定x个音素,得到目标音素集,包括:在所述帧时序相同的语音帧对应的n
×
m个候选音素中存在相同候选音素的情况下,将所述相同候选音素的后验概率累加,得到后验概率累加后...
【专利技术属性】
技术研发人员:潘敏,杨吉,
申请(专利权)人:思必驰科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。