全时免唤醒误触发识别方法、装置、系统及存储介质制造方法及图纸

技术编号：41136072 阅读：8 留言：0更新日期：2024-04-30 18:07

本申请公开一种全时免唤醒误触发识别方法、装置、系统及存储介质，涉及语音识别技术领域。该方法包括获取语音识别结果，包括第一语音识别结果和第二语音识别结果；在预设时间内对第一语音识别结果与第二语音识别结果进行判断，得到判断结果，根据判断结果调整当前的识别模式；对语音识别结果进行处理，得到语义结果，并根据语义结果，得到语义置信度；根据当前的识别模式对语义置信度进行判断，得到识别结果。本申请实施例根据不同的识别模式，对高置信度语义结果的响应能够更有信心地响应用户的输入，也能够更灵活地处理低置信度的语义结果，防止因置信度不足导致的误操作，实现了避免误触发与避免丢触发的同时兼备。

全部详细技术资料下载

【技术实现步骤摘要】

本申请属于语音识别，尤其涉及一种全时免唤醒误触发识别方法、装置、系统及存储介质。

技术介绍

1、目前现有的优化全时免唤醒误触发通常有两种方法，其中一种为提高识别结果的置信度来避免误触发，另一种为提高语义结果的置信度来避免误触发。

2、提高识别结果的置信度来避免误触发是在拿到识别结果时，判断识别结果的置信度，如果识别结果置信度低于设置的值则认为本次识别结果不可信，需要丢弃本次结果，从而实现避免误触发；提高语义结果的置信度来避免误触发是在拿到语义结果时，判断语义结果的置信度，如果语义结果置信度低于设置的值则认为本次语义结果不可信，需要丢弃本次结果，从而实现避免误触发。

3、但以上两种方法有一个共同的缺陷是识别结果置信度与语义结果置信度为各自独立的判断方式，通过各自的置信度判断来丢弃结果容易导致应该被触发的说法也被丢弃，识别与语义各自相互独立，在各自的置信度做判断并且互相不干扰，这种独立判断校验的方式无法实现将两种判断做一个相互补充的关系，从而没办法实现避免误触发与避免丢触发同时兼备。

技术实现思路

1、本申请的目的，在于提供一种全时免唤醒误触发识别方法、装置、系统及存储介质，根据语音识别结果调整当前的识别模式，结合当前的识别模式和根据语义结果得到的语义置信度，判断得到识别结果，实现避免误触发与避免丢触发的同时兼备。

2、为了达成上述目的，本申请的解决方案是：

3、第一方面，本申请实施例提供一种全时免唤醒误触发识别方法，包括：

5、在预设时间内对第一语音识别结果与第二语音识别结果进行判断，得到判断结果，根据判断结果调整当前的识别模式，识别模式包括奖励模式、惩罚模式和常规模式；

6、对语音识别结果进行处理，得到语义结果，并根据语义结果，得到语义置信度；

7、不同的识别模式对应不同的语义置信度的判断阈值，惩罚模式对应的语义置信度的判断阈值为第一阈值θ1，常规模式对应的语义置信度的判断阈值为第二阈值θ2，奖励模式对应的语义置信度的判断阈值为第三阈值θ3，其中θ1>θ2>θ3；

8、根据当前的识别模式对语义置信度进行判断，得到识别结果。

9、根据本申请实施例的上述方法，还可以具有以下附加技术特征：

10、进一步的，在预设时间内对第一语音识别结果与第二语音识别结果进行判断，得到判断结果，根据判断结果调整当前的识别模式，包括：

11、若在预设时间内，判断第一语音识别结果与第二语音识别结果相同，则调整当前的识别模式为奖励模式。

12、进一步的，在预设时间内对第一语音识别结果与第二语音识别结果进行判断，得到判断结果，根据判断结果调整当前的识别模式，包括：

13、若在预设时间内，判断第一语音识别结果与第二语音识别结果不同，则基于第一语音识别结果，得到识别置信度，根据识别置信度与预设阈值的关系，调整当前的识别模式。

14、进一步的，根据识别置信度与预设阈值的关系，调整当前的识别模式，包括：

15、若识别置信度小于预设阈值，则增加一次拒识数组的数量，并丢弃第一语音识别结果；

16、若在预设时间内，拒识数组的数量增加超过三次，则调整当前的识别模式为惩罚模式。

17、进一步的，根据当前的识别模式对语义置信度进行判断，得到识别结果，包括：

18、判断当前的识别模式是否为奖励模式，若当前的识别模式为奖励模式，则判断语义置信度是否大于第三阈值θ3；

19、若语义置信度大于第三阈值θ3，则识别结果为响应唤醒消息；

20、若语义置信度小于第三阈值θ3，则识别结果为丢弃结果。

21、进一步的，根据当前的识别模式对语义置信度进行判断，得到识别结果，包括：

22、若当前的识别模式不为奖励模式，则判断当前的识别模式是否为惩罚模式，若当前的识别模式为惩罚模式，则判断语义置信度是否大于第一阈值θ1；

23、若语义置信度大于第一阈值θ1，则识别结果为响应唤醒消息；

24、若语义置信度小于第一阈值θ1，则识别结果为丢弃结果。

25、进一步的，根据当前的识别模式对语义置信度进行判断，得到识别结果，包括：

26、若当前的识别模式既不是奖励模式，也不是惩罚模式，则判断当前的识别模式为常规模式，判断语义置信度是否大于第二阈值θ2；

27、若语义置信度大于第二阈值θ2，则识别结果为响应唤醒消息；

28、若语义置信度小于第二阈值θ2，则识别结果为丢弃结果。

29、第二方面，本申请实施例提供一种全时免唤醒误触发识别装置，包括：

30、数据获取模块，被配置为用于获取语音识别结果，语音识别结果包括第一语音识别结果和第二语音识别结果，第二语音识别结果为第一语音识别结果上一次的语音识别结果；

31、模式调整模块，被配置为用于在预设时间内对第一语音识别结果与第二语音识别结果进行判断，得到判断结果，根据判断结果调整当前的识别模式，识别模式包括奖励模式、惩罚模式和常规模式；

32、语义理解模块，被配置为用于对语音识别结果进行处理，得到语义结果，并根据语义结果，得到语义置信度；

33、不同的识别模式对应不同的语义置信度的判断阈值，惩罚模式对应的语义置信度的判断阈值为第一阈值θ1，常规模式对应的语义置信度的判断阈值为第二阈值θ2，奖励模式对应的语义置信度的判断阈值为第三阈值θ3，其中θ1>θ2>θ3；

34、结果识别模块，被配置为用于根据当前的识别模式对语义置信度进行判断，得到识别结果。

35、第三方面，本申请实施例提供了一种全时免唤醒误触发识别系统，系统包括处理器和存储器，存储器中存储有计算机程序，计算机程序由处理器加载并执行，以实现如本申请实施例第一方面提供的全时免唤醒误触发识别方法。

36、第四方面，本申请实施例提供了一种计算机可读存储介质，存储介质中存储有计算机程序，计算机程序被处理器执行时，用于实现如本申请实施例第一方面的全时免唤醒误触发识别方法。

37、采用本申请实施例提供的全时免唤醒误触发识别方法，与现有技术相比，具有如下有益技术效果：

38、本申请实施例通过在预设时间内对第一语音识别结果与第二语音识别结果进行判断，并根据判断结果调整当前的识别模式，可以实现模式的自适应，能够根据用户的交互行为和语音输入的变化来灵活调整识别模式，提高了识别的适应性和性能；

39、通过在预设时间内对语音识别结果进行判断，能够在实时性要求较高的场景中作出及时的调整，对于需要快速响应用户输入的应用场景(如语音助手、语音控制等)是非常重要的；

40、不同的识别模式对应不同的本文档来自技高网...

【技术保护点】

1.一种全时免唤醒误触发识别方法，其特征在于，所述方法包括：

2.如权利要求1所述的全时免唤醒误触发识别方法，其特征在于，所述在预设时间内对所述第一语音识别结果与所述第二语音识别结果进行判断，得到判断结果，根据所述判断结果调整当前的识别模式，包括：

3.如权利要求1所述的全时免唤醒误触发识别方法，其特征在于，所述在预设时间内对所述第一语音识别结果与所述第二语音识别结果进行判断，得到判断结果，根据所述判断结果调整当前的识别模式，包括：

4.如权利要求3所述的全时免唤醒误触发识别方法，其特征在于，所述根据所述识别置信度与预设阈值的关系，调整所述当前的识别模式，包括：

5.如权利要求1所述的全时免唤醒误触发识别方法，其特征在于，所述根据所述当前的识别模式对所述语义置信度进行判断，得到识别结果，包括：

6.如权利要求5所述的全时免唤醒误触发识别方法，其特征在于，所述根据所述当前的识别模式对所述语义置信度进行判断，得到识别结果，包括：

7.如权利要求6所述的全时免唤醒误触发识别方法，其特征在于，所述根据所述当前的识别模

8.一种全时免唤醒误触发识别装置，其特征在于，所述装置包括：

9.一种全时免唤醒误触发识别系统，所述系统包括处理器和存储器，所述存储器中存储有计算机程序，其特征在于，所述计算机程序由所述处理器加载并执行，以实现如权利要求1至7任一项所述的全时免唤醒误触发识别方法。

10.一种计算机可读存储介质，所述存储介质中存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，用于实现如权利要求1至7任一项所述的全时免唤醒误触发识别方法。

...

【技术特征摘要】

1.一种全时免唤醒误触发识别方法，其特征在于，所述方法包括：

4.如权利要求3所述的全时免唤醒误触发识别方法，其特征在于，所述根据所述识别置信度与预设阈值的关系，调整所述当前的识别模式，包括：

5.如权利要求1所述的全时免唤醒误触发识别方法，其特征在于，所述根据所述当前的识别模式对所述语义置信度进行判断，得到识别结果，包括：

【专利技术属性】
技术研发人员：邓建凯，杨吉，
申请(专利权)人：思必驰科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人