语音信息处理方法及设备技术

技术编号：29882510 阅读：21 留言：0更新日期：2021-09-01 00:00

本申请实施例公开了一种语音信息处理方法及设备，该方法包括：获取第一语音信息；在基于判决条件确定该第一语音信息为有效的语音控制指令的情况下，执行该第一语音信息指示的操作，其中，该判决条件为基于该第一语音信息产生时所在的环境情况调整得到。本申请能够在不同的智能语音交互场景中提高有效语音识别的准确率，降低无效语音的误触发率。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】语音信息处理方法及设备
本申请涉及语音处理
，具体涉及语音信息处理方法及设备。
技术介绍
在智能语音交互场景中，智能设备存在两种常用的聆听用户语音的模式，分别是持续聆听模式和全时免唤醒模式，全时免唤醒模式又可以称为全时聆听模式。持续聆听或全时聆听状态下，智能设备需要区分用户内容是否为对其有效的指令，即需要区分人与机器的对话内容、人与人的对话内容。具体的，在聆听状态下，设备采集到的语音信息包括闲聊数据，为避免智能设备被闲聊内容误触发，常利用规则匹配模块，或利用推理模块(如神经网络推理模块)进行判断获取到的语音信息是否为有效的语音控制指令。但是，由于在不同的使用环境和场景下，相同的语音信息或者相同语义的语音信息的有效性可能不同，例如，某个语句在当前场景下属于有效的语音控制指令，但是在另一个场景下只是闲聊的信息，属于无效信息。而现有的语音信息有效判定方案无法适应这种不同使用环境和场景下的语音信息有效性识别，容易导致识别准确率低，无效语音误触发的情况。综上所述，如何在不同的智能语音交互场景中提高有效语音识别的准...

【技术保护点】
1.一种语音信息处理方法，其特征在于，所述方法包括：/n获取第一语音信息；/n在基于判决条件确定所述第一语音信息为有效的语音控制指令的情况下，执行所述第一语音信息指示的操作，其中，所述判决条件为基于所述第一语音信息产生时所在的环境情况调整得到。/n

【技术特征摘要】
【国外来华专利技术】1.一种语音信息处理方法，其特征在于，所述方法包括：
获取第一语音信息；
在基于判决条件确定所述第一语音信息为有效的语音控制指令的情况下，执行所述第一语音信息指示的操作，其中，所述判决条件为基于所述第一语音信息产生时所在的环境情况调整得到。

2.根据权利要求1所述的方法，其特征在于，所述第一语音信息产生时所在的环境情况包括如下的一项或多项：
截止至所述设备获取到该第一语音信息的第二预设时长内的说话人数，所述第一语音信息产生时预设范围内的人数，所述第一语音信息的置信度，或所述第一语音信息的信噪比。

3.根据权利要求1或2所述的方法，其特征在于，所述判决条件为基于所述第一语音信息产生时所在的环境情况调整得到，包括：
所述判决条件为基于所述环境情况以及设备的持续聆听时长调整得到。

4.根据权利要求3所述的方法，其特征在于，所述判决条件为基于所述环境情况以及设备的持续聆听时长调整得到，包括：
所述判决条件为基于所述环境情况、所述持续聆听时长以及历史语音信息的情况调整得到。

5.根据权利要求1或2所述的方法，其特征在于，所述判决条件为基于所述第一语音信息产生时所在的环境情况调整得到，包括：
所述判决条件为基于所述环境情况以及历史语音信息的情况调整得到。

6.根据权利要求4或5所述的方法，其特征在于，所述历史语音信息的情况包括如下中的一种或多种：
获取所述第一语音信息时与最近一次获取到有效语音信息之间的第一时间间隔；
获取所述第一语音信息时与最近一次获取到无效语音信息之间的第二时间间隔；
获取到所述第一语音信息前第一预设时长内有效语音信息和无效语音信息的占比；
所述第一语音信息与最近一次获取到的有效语音信息的语义的第一关联度；
所述第一语音信息与最近一次获取到的无效语音信息的语义的第二关联度；
第一语音信息与设备最近一次获取到的有效语音信息的第三关联度；
截止至获取到所述第一语音信息时设备与用户语音对话的状态；
所述第一语音信息与历史有效语音信息的声学特征的第一相似度；
所述第一语音信息与历史无效语音信息的声学特征的第二相似度。

7.根据权利要求1至6任一项所述的方法，其特征在于，
在所述环境情况指示所述第一语音信息有效的概率大于无效的概率的情况下，所述判决条件的灵敏度被调高；
在所述环境情况指示所述第一语音信息有效的概率小于无效的概率的情况下，所述判决条件的灵敏度被调低。

8.根据权利要求3或4所述的方法，其特征在于，所述设备的持续聆听时长越长所述判决条件的灵敏度被调得越低。

9.根据权利要求4至6任一项所述的方法，其特征在于，所述历史语音信息的情况包括获取所述第一语音信息时与最近一次获取到有效语音信息之间的第一时间间隔；
所述第一时间间隔越长所述判决条件的灵敏度被调得越低。

10.根据权利要求4至6任一项所述的方法，其特征在于，所述历史语音信息的情况包括获取所述第一语音信息时与最近一次获取到无效语音信息之间的第二时间间隔；
所述第二时间间隔越长所述判决条件的灵敏度被调得越低。

11.根据权利要求4至6任一项所述的方法，其特征在于，所述历史语音信息的情况包括获取所述第一语音信息时与最近一次获取到有效语音信息之间的第一时间间隔，以及包括获取所述第一语音信息时与最近一次获取到无效语音信息之间的第二时间间隔；
在所述第一时间间隔小于所述第二时间间隔的情况下，所述判决条件的灵敏度被调高。

12.根据权利要求4至6任一项所述的方法，其特征在于，所述历史语音信息的情况包括获取到所述第一语音信息前第一预设时长内有效语音信息和无效语音信息的占比；
在所述有效语音信息的占比大于所述无效语音信息的占比的情况下，所述判决条件的灵敏度被调高；
在所述有效语音信息的占比小于所述无效语音信息的占比的情况下，所述有效语音信息的占比呈上升趋势，所述判决条件的灵敏度被调高；所述有效语音信息的占比呈下降趋势，所述判决条件的灵敏度被调低。

13.根据权利要求4至6任一项所述的方法，其特征在于，所述历史语音信息的情况包括截止至获取到所述第一语音信息时设备与用户语音对话的状态；
在所述设备与用户语音对话的状态存在的情况下，所述判决条件的灵敏度被调高。

14.一种语音信息处理装置，其特征在于，所述装置包括：
获取单元，用于获取第一语音信息；
执行单元，用于在基于判决条件确定所述第一语音信息为有效的语音控制指令的情况下，执行所述第一语音信息指示的操作，其中，所述判决条件为基于所述第一语音信息产生时所在的环境情况调整得到。

15.根据权利要求14所述的装置，其特征在于，所述第一语音信息产生时所在的环境情况包括如下的一项或多项：
截止至所述设备获取到该第一语音信息的...

【专利技术属性】
技术研发人员：杨世辉，聂为然，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人