语音免唤醒交互方法、装置、车辆及存储介质制造方法及图纸

技术编号:38820444 阅读:26 留言:0更新日期:2023-09-15 19:59
本申请涉及一种语音免唤醒交互方法、装置、车辆及存储介质,其中,方法包括:获取用户的音频数据,并判断音频数据是否满足预设的非唤醒场景触发条件;若音频数据不满足预设的非唤醒场景触发条件,则确定音频数据对应的目标场景,并在目标场景识别音频数据得到语义结果,并判断语义结果对应的场景与目标场景是否相同;若语义结果对应的场景与目标场景相同,则根据语义结果对应的控制指令控制当前车辆执行相应的动作。由此,解决相关技术需要引入特定唤醒词才能进行语音交互,导致交互体验不好的问题,可以将识别语义结果同唤醒结果校验后再确定是否执行动作并唤醒语音助手,增加语义结果的校验,降低了误触率,同时满足全时免唤醒的需求。唤醒的需求。唤醒的需求。

【技术实现步骤摘要】
语音免唤醒交互方法、装置、车辆及存储介质


[0001]本申请涉及车辆
,特别涉及一种语音免唤醒交互方法、装置、车辆及存储介质。

技术介绍

[0002]在当前智能语音使用中,普遍是需要通过特定唤醒词唤醒后才能进行语音交互,引入特定唤醒词主要是基于为了降低误触概率和系统资源的占用,但是,对于车载用户的某些高频场景使用过程中,如果还需要每次通过唤醒词唤醒后才能开始后续的操作会使得交互体验不太友好。
[0003]相关技术,一种利用多模(摄像头或其他设备)来触发指令和降低误触发率。能较好得实现功能和需求,另一种根据界面变化动态使用不同的免唤醒词列表,从而达到免唤醒效果同时也能较好的降低误触概率
[0004]然而,相关技术会增加产品较多得成本,不利于向更多得车型提供该功能;另一种案使用场景有限,在没有界面时就无法做到免唤醒交互。

技术实现思路

[0005]本申请提供一种语音免唤醒交互方法、装置、车辆及存储介质,以解决相关技术利用多模增加产品成本的问题,降低了系统资源占用和项目成本,增加语义结果的校验从而降低了误触率,同本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音免唤醒交互方法,其特征在于,包括以下步骤:获取用户的音频数据,并判断所述音频数据是否满足预设的非唤醒场景触发条件;若所述音频数据不满足预设的非唤醒场景触发条件,则确定所述音频数据对应的目标场景,并在所述目标场景识别所述音频数据得到语义结果,并判断所述语义结果对应的场景与所述目标场景是否相同;以及若所述语义结果对应的场景与所述目标场景相同,则根据所述语义结果对应的控制指令控制当前车辆执行相应的动作。2.根据权利要求1所述的方法,其特征在于,在判断所述音频数据是否满足所述预设的非唤醒触发条件之后,还包括:若所述音频数据满足所述预设的非唤醒场景触发条件,则以所述音频数据对应的控制指令对当前车辆进行控制。3.根据权利要求1所述的方法,其特征在于,在判断所述语义结果对应的场景与所述目标场景是否相同之后,还包括:若所述语义结果对应的场景与所述目标场景不同,则丢弃所述语义结果。4.根据权利要求1所述的方法,其特征在于,在获取所述用户的音频数据之后,还包括:对所述音频数据进行预处理,并基于预设的消噪策略对预处理后的所述音频数据进行消噪处理。5.根据权利要求1所述的方法,其特征在于,在根据所述语义结果对应的控制指令控制当前车辆执行相应的动作之后,还包括:获取所述当前车辆的执行结果;根据所述当前车辆的执行结果生成结果播报指令,并基于所述结果播报指令控制所述车辆进行语音播报提醒。6.根据权利要求1所述的方法,其特征在于,在判定所述语义结果对应的场景与所述目标场景相同之后...

【专利技术属性】
技术研发人员:赖坤刘大全
申请(专利权)人:重庆长安汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1