一种降低远场语音误激活的方法技术

技术编号：37872166 阅读：22 留言：0更新日期：2023-06-15 21:01

本发明专利技术涉及远场语音控制领域，其公开了一种降低远场语音误激活的方法，解决现有技术中对误激活问题的解决方案中存在的需要大量误激活音频数据的标注，周期长，成本高且需要本地模型持续升级或者需要牺牲激活性能，降低用户体验的问题。本发明专利技术方案中，在拾取到激活音频后，在本地激活声学模型对激活音频的特征匹配检查的基础上，通过与云端ASR语音识别服务器的网络通信，将激活音频上传至云端ASR语音识别服务器，利用服务器的算力加持对激活音频进行二次判断，使得对激活音频是否响应的结论更加准确，可以有效的降低错误的激活响应，从而在保证较高的激活率的同时让用户体验到低的误激活率。本发明专利技术适用于远场语音控制的智能设备。设备。设备。

全部详细技术资料下载

【技术实现步骤摘要】
一种降低远场语音误激活的方法

[0001]本专利技术涉及远场语音控制领域，具体涉及一种降低远场语音误激活的方法。

技术介绍

[0002]远场语音技术作为人工智能的重要技术方向，旨在帮助用户非接触式的与机器进行直接交互，对用户尤其是残障人士具有普惠价值。近几年因应国内国际市场语音需求的增长，技术投入加大，在激活、识别准确率等性能方面实现了跨域式的进步。
[0003]然而激活更灵敏，也意味着误激活也更易发生。误激活是指用户没有主动操作时，内部或者外部噪声激发远场语音作出了错误响应，干扰了用户正常使用的现象。
[0004]目前，现有技术中针对误激活问题的解决思路主要有两种方式：
[0005](1)激活模型的升级优化：
[0006]通过持续收集误激活音频，逐一甄别后贴上标签，打包成数据集，让本地声学模型进行学习。该方案存在以下问题：其一是周期长，人力成本高；其二是声音环境千变万化，不可能将所有的声音做标注，让机器学习；其三是模型需要持续升级，才能保证误激活长期在一个低水平。
[0007](2)

【技术保护点】

【技术特征摘要】
1.一种降低远场语音误激活的方法，应用于具有远场语音功能的智能设备，其特征在于，所述智能设备云端ASR语音识别服务器通信，所述降低远场语音误激活的方法包括：智能设备的拾音前端拾取激活音频；利用部署在智能设备本地的激活声学模型对激活音频的声学特征进行检测，获得第一检测结果，并将激活音频打包通过网络上传至云端ASR语音识别服务器进行激活词检测，获得第二检测结果并反馈给智能设备；智能设备根据所述第一检测结果和第二检测结果综合判断是否响应所述激活音频。2.如权利要求1所述的一种降低远场语音误激活的方法，其特征在于，所述利用部署在智能设备本地的激活声学模型对激活音频的声学特征进行检测，获得第一检测结果，具体包括：激活声学模型将激活音频的声学特征与满足激活条件的声学特征进行特征匹配，将特征匹配的结果作为第一检测结果。3.如权利要求1或2所述的一种降低远场语音误激活的方法，其特征在于，所述将激活音频打包通过网络上传至云端ASR语音识别服务器进行激活词检测，获得第二检测结果，具体包括：云端ASR语音识别服务器对收到的激活音频转换为文本内容，并将文本内容同预设的激活词进行匹配，将与激活词的匹配结果作为第二检测结果。4.如权利要求3所述的一种降低远场语音误激活的方法，其特征在于，所述将文本内容同预设的激活词进行匹配，包括：判断文本内容与预设的激活词之间的匹配度是否达到设置的匹配度阈值，所述匹配度阈值根据实际需求设置。5....

【专利技术属性】
技术研发人员：雷伟，
申请(专利权)人：四川长虹电器股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人