一种基于参数共享的两阶段语音唤醒方法技术

技术编号：37789260 阅读：12 留言：0更新日期：2023-06-09 09:19

本发明专利技术公开了一种基于参数共享的两阶段语音唤醒方法，基于整句的自注意力模型或基于分块的流式自注意力模型，语音唤醒方法，所采用的方法是结合这两种自注意力模式。可以一次性训练一个包含两阶段唤醒的语音模型。该方法在满足高唤醒率低误触率要求的前提下，简化了训练流程和推理部分的工程实现。训练流程和推理部分的工程实现。训练流程和推理部分的工程实现。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于参数共享的两阶段语音唤醒方法

[0001]本专利技术涉及语音识别
，特别是一种基于参数共享的两阶段语音唤醒方法。

技术介绍

[0002]随着语音识别技术的飞速发展，语音唤醒技术的应用越来越普遍。语音唤醒功能作为智能家居设备的主要功能，已经越来越多应用于家庭生活场景之中，但由于家庭语音环境的复杂情况，容易导致误触发的情况发生，这非常影响用户的实际体验。目前业界通常会采用两级唤醒的模式降低误触发。具体来说就是，第一级唤醒主要用于全天候监听，二级唤醒是在发生可能疑似唤醒的时候，利用一个更优的模型做二次打分，以此作为最终的决策。这种两级语音唤醒机制，可以非常有效地降低误触发的概率。另外，考虑到功耗问题，一级唤醒通常采用模型尺寸小延迟小的唤醒模型，二级则考虑效果更好参数更大的唤醒模型。因此一二级唤醒模型的结构通常差异较大，这就要求在训练模型阶段分别训练一二级唤醒模型。

技术实现思路

[0003]本专利技术要解决的技术问题是提供了一种基于参数共享的两阶段语音唤醒方法，可以一次性训练一个包含两阶段唤醒的语音模型。该方法在满足高唤醒率低误触率要求的前提下，简化了训练流程和推理部分的工程实现。
[0004]为了解决上诉技术问题，本专利技术采用如下技术方案：
[0005]上述的一种基于参数共享的两阶段语音唤醒方法，其中：基于整句的自注意力模型或基于分块的流式自注意力模型，语音唤醒方法，所采用的方法是结合这两种自注意力模式。
[0006]两个唤醒阶段(即全天候监听阶段和二次验证两个阶段...

【技术保护点】

【技术特征摘要】
1.一种基于参数共享的两阶段语音唤醒方法，其特征在于，基于整句的自注意力模型或基于分块的流式自注意力模型，语音唤醒方法，所采用的方法是结合这两种自注意力模式；两个唤醒阶段，即全天候监听阶段和二次验证两个阶段，使用了同一组参数的模型，全天候监听阶段采用了将基于分块的在线(流式)注意力机制，二次验证阶段采用了基于整句的离线注意力机制，其中，基于分块的在线(流式)注意力机制是通过限制自注意力机制范围对局部依赖信息进行建模。2.如权利要求1所述的一种基于参数共享的两阶段语音唤醒方法，其特征在于：基于整句的自注意力模型或基于分块的流式自注意力模型，语音唤醒方法，所采用的方法是结合这两种自注意力模式。3.如权利要...

【专利技术属性】
技术研发人员：黄乐凯，何昕，
申请(专利权)人：上海声瀚信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人