【技术实现步骤摘要】
一种语音唤醒方法、系统及存储介质
[0001]本专利技术涉及智能座舱领域,具体涉及一种语音唤醒方法、系统及存储介质。
技术介绍
[0002]语音作为最直接、最便利的交互方式,天然具有比物理触碰交互方式更便捷的属性,得益于技术的不断发展,语音唤醒被应用到越来越多的领域和场景中。语音唤醒技术的实现方案很多,通常包括:基于识别技术的唤醒方案,通过判断识别结果是否包含唤醒词来决定是否唤醒。
[0003]对于二次唤醒方案来说,为了唤醒精度考虑一般第二次唤醒判断用到的大模型计算量复杂,通常只能放置于服务端计算。如此,二次判决效率会受到网络环境约束,如果网络不稳定,二次判决失效不能正确返回大模型判决结果,系统唤醒出现误判。
[0004]因此,需要对现有的语音唤醒技术进一步改进,以期既通过二次唤醒组合一次唤醒提高唤醒识别精度,又能保障二次唤醒计算效率,进一步使其也适用于在车端运行。
技术实现思路
[0005]为了解决现在技术存在的以上问题,本专利技术提供一种语音唤醒方法、系统及存储介质,目的是提升二次唤醒精度、效率,并使其既适用于服务端,更适用于在车端运行。
[0006]本专利技术采用的技术方案如下:
[0007]本专利技术在第一方面,公开一种语音唤醒方法,包括以下步骤,
[0008]步骤1)获取一次唤醒词,比较一次唤醒词置信度与设定的一次唤醒阈值,大于时,唤醒;小于时,列为疑似唤醒样本;否则,不唤醒;
[0009]步骤2)计算疑似唤醒样本对应的二次唤醒词置信度,比较二 ...
【技术保护点】
【技术特征摘要】
1.一种语音唤醒方法,其特征在于:包括以下步骤,步骤1)获取一次唤醒词,比较一次唤醒词置信度与设定的一次唤醒阈值,大于时,唤醒;小于时,列为疑似唤醒样本;步骤2)计算疑似唤醒样本对应的二次唤醒词置信度,比较二次唤醒词置信度与实时状态下的动态唤醒阈值,大于时,唤醒;小于,不唤醒;所述动态唤醒阈值通过以下方式获得:获取当前驾驶舱状态,所述驾驶舱状态包括车辆状态和/或乘客状态,根据不同驾驶舱状态进行环境评分,根据评分结果查询动态阈值表选择不同唤醒动态阈值。2.如权利要求1所述语音唤醒方法,其特征在于:步骤1)中比较一次唤醒词置信度与设定的一次唤醒阈值,当小于且在设定范围时,列为疑似唤醒样本,否则,不唤醒。3.如权利要求2所述语音唤醒方法,其特征在于:所述设定范围是指小于一次唤醒阈值且大于α乘以一次唤醒阈值,其中α为0到1之间的浮点数。4.如权利要求1所述的语音唤醒方法,其特征在于:所述动态阈值表由以下方式构建:收集含有车辆状态和乘客状态信息的驾驶舱状态信息,车辆状态信息含空调状态、车速、车窗状态、音乐、电台状态至少之一的因素,乘客状态含说话状态及人数至少之一的因素,将各因素设置权重,构建驾驶舱环境评分公式,将预期评分结果划分表达安静程度的等级,安静程度越高的等级对应动态阈值越大,将安静程度的等级与对应唤醒动态阈值构建动态阈值表。5.如权利要求1所述的语音唤醒方法,其特征在于:所述一次唤醒词置信度、二次唤醒词对应的唤醒词置信度由以下方式获得,其中,n表示唤醒阶段的声学特征的数量,P表示声学特征的后验概率,SCORE表示唤醒词置信度。6.如权利要求5所述的语音唤醒方法,其特征在于:所述声学特征采用唤醒词对应的各个音素。7.如权利要求1至6任一项所述的语音唤醒方法,其特征在于:所述一次唤醒置信度和二次唤醒置信度均是将获取的本次唤醒阶段的声学特征,采用各自阶段的声学模型计算各声学特征的后验概率,再通过唤醒置信度计算而得到;其中在二次唤醒阶段,仅采集二次唤醒阶段的声学特征中的奇数帧或偶数帧的声学特征,将声学特征送入二次唤醒阶段的声学模型。8.如权利要求7所述的语音唤醒方法,其特征在于:所述声学模型由以下方式训练获得,步骤a)使用准备好的正负样本训练数据训练GMM
‑
HMM声学模型;步骤b)使用训练好的GMM
‑
HMM声学模型对训练数据重新进行对齐;步骤c)使用对齐之后的数据训练DNN
‑
HMM音素级声学模型。9.如权利要求8所述的语音唤醒方法,其特征在于:二次唤醒阶段的第二声学模型与一次唤醒阶段的第一声学模型满足至少以下之一条件:第二声学模型的网络层数多于第一声学模型的网络层数;第二声学模型至少一个网络层节点数多于第一声学模型的相应网络层节点数。
10.一种语音唤醒系统,其特征在于:包括一次唤醒打分模块、动态唤醒阈值计算模块和二次唤醒校验模块;所述一次唤醒打分模块获取一次唤醒词,比较一次唤醒词置信度与设定的一次唤醒阈值,大于时,唤醒;小于时,列为疑似唤醒样本;否则,不唤醒;所述二次唤醒校验模块计算疑似唤醒样本对应的二次唤醒词置信度,比较二次唤醒词置信度与实时状态下的动态唤醒阈值,大于时,唤醒;小于,不唤醒;所述动态阈值计算模块获取当前驾驶舱状态,所述驾驶舱状态包括车辆状态和乘客状态,根据不同驾驶舱状态对环境进行评分,根据评分结果查询动态阈值表动态选择生成不同唤醒动态阈值。11....
【专利技术属性】
技术研发人员:张志辉,
申请(专利权)人:重庆长安汽车股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。