【技术实现步骤摘要】
一种语音唤醒方法、装置、电子设备及存储介质
[0001]本申请涉及语音识别领域,特别是涉及一种语音唤醒方法、装置、电子设备及存储介质。
技术介绍
[0002]语音作为最常用的交流方式之一,自1960年以来,就作为很自然的人机交互方式,被重点研究,并在过去的十几年时间取得了显著的进步。同时随着硬件性能的迅速发展,人工智能相关技术也日益成熟,各种智能设备层出不穷,进入普通用户的生活中。语音交互作为可以解放人双手的交互方式,深受用户喜爱,成为使用频率最高的一种交互方式,如语音唤醒,语音识别等。这也带动了诸如智能手机、智能家居等行业的发展,在表现出巨大需求和市场潜力的同时,语音唤醒作为语音识别的入口,对唤醒和误唤醒的效果也有了更高的要求。
[0003]目前,随着日益增长的市场需求,一个产品拥有几个甚至几十个的唤醒词越来越普遍,而这对唤醒词之间的串扰也带来了更大的挑战,这同样也是业内的难题。
技术实现思路
[0004]本申请至少提供一种语音唤醒方法、装置、电子设备及存储介质,能够有效降低多唤醒词之间的串扰。r/>[0005]本本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种语音唤醒方法,其特征在于,包括:获取第一语音数据;对所述第一语音数据进行语音识别,得到所述第一语音数据所表示的第一唤醒词;按照所述第一唤醒词进行第一唤醒操作;以及在所述第一唤醒操作后的预设时间内对所述第一唤醒词进行预设惩罚操作,所述预设惩罚操作用于降低将所述预设时间内获取的第二语音数据识别为所述第一唤醒词的概率。2.根据权利要求1所述的方法,其特征在于,所述在所述第一唤醒操作后的预设时间内对所述第一唤醒词进行预设惩罚操作,包括:响应于在所述预设时间内获取到第二语音数据,利用所述第一唤醒词的惩罚系数对所述第二语音数据进行语音识别,得到所述第二语音数据所表示的第二唤醒词,其中,所述第一唤醒词的惩罚系数用于降低所述第二语音数据识别为所述第一唤醒词的概率;按照所述第二唤醒词进行第二唤醒操作。3.根据权利要求2所述的方法,其特征在于,所述第一唤醒词的惩罚系数随时间增加而减小。4.根据权利要求1
‑
3中任一项所述的方法,其特征在于,所述利用所述第一唤醒词的惩罚系数对所述第二语音数据进行语音识别,得到所述第二语音数据所表示的第二唤醒词,包括:获取所述第二语音数据的声学状态后验概率;基于所述第二语音数据的声学状态后验概率和所述第一唤醒词的惩罚系数进行解码,得到所述第二唤醒词,其中,所述惩罚系数用于降低所述解码过程中所述第二语音数据的至少部分发音状态的状态转移概率。5.根据权利要求4所述的方法,其特征在于,所述基于所述第二语音数据的声学状态后验概率和所述第一唤醒词的惩罚系数进行解码,得到所述第二唤醒词,包括:基于所述第二语音数据的声学状态后验概率,确定所述第二语音数据对应的若干第一候选发音序列中各相邻发音状态间的状态转移概率;从所述若干第一候选发音序列中选出至少一组子发音序列,并利用所述惩罚系数,降低各组所述子发音序列中的各相邻发音状态间的状态转移概率,其中,所述子发音序列由所述第一候选发音序列中连续的至少两个发音状态组成,所述子发音序列中除首尾以外的发音状态为所述第一唤醒词所包含的发音状态。6.根据权利要求5所述的方法,其特征在于,所述利用所述惩罚系数,降低各组所述子发音序列中的各相邻发音状态间的状态转移概率,包括:对于各组所述子发音序列中的各组相邻发音状态,将所述相邻发音状态的状态转移概率乘以与所述相邻发音状态对应的惩罚系数,得到所述相邻发音状态间当前的状态转移概率,其中,所述惩罚系数小于1,不同组所述相邻发音状态对应的惩罚系数相同或不同;和/或,在所述按照所述第二唤醒词进行第二唤醒操作之前,还包括:获取所述第一最优候选...
【专利技术属性】
技术研发人员:郭朝辉,许丽,熊世富,潘嘉,刘聪,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。