【技术实现步骤摘要】
语音信息处理及验证模型训练方法、装置、设备及介质
本专利技术涉及语音处理
,尤其涉及一种语音信息的处理及验证模型的训练方法、装置、设备及介质。
技术介绍
随着智能交互技术的迅猛发展,在智能车载和智能家居领域中,可以通过识别采集的包含指令词的语音信息,实现控制智能设备完成该指令词对应的任务,例如,识别采集的包含调整温度的语音信息,控制智能空调进行温度调节,或,识别采集的包含调整风向的语音信息,控制智能空调进行风向调整等。现有技术中,智能设备采集到语音信息后,将该语音信息划分为多个语音帧,并通过梅尔倒谱系数(Mel-frequencycepstralcoefficients,MFCC)、滤波器组(FilterBank,FBank)等方法提取每个语音帧对应的语音特征。然后基于语音信息的处理的声学模型以及解码网络,获取智能设备采集的语音信息对应的语音元素序列。将该语音元素序列与预先配置的任一指令语音元素序列进行匹配,确定该语音信息中包含该匹配的指令语音元素序列对应的指令词,获取该指令词对应的操作并执行,即可实现 ...
【技术保护点】
1.一种语音信息的处理方法,其特征在于,所述方法包括:/n基于解码网络,获取智能设备采集的语音信息对应的第一语音元素序列;/n若所述第一语音元素序列与预先配置的任一指令语音元素序列匹配,基于所述第一语音元素序列,确定第一组合向量;/n若通过预先训练的验证模型,根据所述第一组合向量,确定所述语音信息被正确识别,控制所述智能设备执行所述匹配的指令语音元素序列对应的指令词的操作。/n
【技术特征摘要】
1.一种语音信息的处理方法,其特征在于,所述方法包括:
基于解码网络,获取智能设备采集的语音信息对应的第一语音元素序列;
若所述第一语音元素序列与预先配置的任一指令语音元素序列匹配,基于所述第一语音元素序列,确定第一组合向量;
若通过预先训练的验证模型,根据所述第一组合向量,确定所述语音信息被正确识别,控制所述智能设备执行所述匹配的指令语音元素序列对应的指令词的操作。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若通过所述验证模型,根据所述第一组合向量,确定所述语音信息未被正确识别,则拒绝响应所述语音信息。
3.根据权利要求1所述的方法,其特征在于,所述基于所述第一语音元素序列,确定第一组合向量,包括:
根据所述第一语音元素序列、以及所述语音信息的特征信息,确定第一组合向量;
其中,所述语音信息的特征信息包括以下至少一种:每个语音帧为静音帧的概率、每个语音帧包含的内容信息为每种语音元素的概率,每个语音帧对应的特征向量,所述语音信息包含的语音帧的数量,以及所述语音信息的语音帧中包含的静音帧的信息。
4.根据权利要求3所述的方法,其特征在于,若所述语音信息的特征信息中包括每个语音帧为静音帧的概率、每个语音帧包含的内容信息为每种语音元素的概率,以及每个语音帧对应的特征向量,所述根据所述第一语音元素序列、以及所述语音信息的特征信息,确定第一组合向量,包括:
根据每个语音帧对应的特征向量,确定平均特征向量;
针对每个语音帧,根据该语音帧为静音帧的概率、该语音帧包含的内容信息为每种语音元素的概率,确定该语音帧对应的概率差值;
根据所述第一语音元素序列、所述平均特征向量、以及所述每个语音帧对应的概率差值,确定所述第一组合向量。
5.根据权利要求4所述的方法,其特征在于,所述根据该语音帧为静音帧的概率、该语音帧包含的内容信息为每种语音元素的概率,确定该语音帧对应的概率差值,包括:
若根据所述第一语音元素序列确定该语音帧为静音帧,则确定该语音帧为静音帧的概率、及包含的内容信息为每种语音元素的概率中的第一极值,根据所述第一极值、该语音帧为静音帧的概率中的任意两者之间差值,确定该语音帧对应的概率差值;或者
若根据所述第一语音...
【专利技术属性】
技术研发人员:陈都,李家魁,吕安超,李宝祥,
申请(专利权)人:北京猎户星空科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。