【技术实现步骤摘要】
一种降低远场语音误激活的方法
[0001]本专利技术涉及远场语音控制领域,具体涉及一种降低远场语音误激活的方法。
技术介绍
[0002]远场语音技术作为人工智能的重要技术方向,旨在帮助用户非接触式的与机器进行直接交互,对用户尤其是残障人士具有普惠价值。近几年因应国内国际市场语音需求的增长,技术投入加大,在激活、识别准确率等性能方面实现了跨域式的进步。
[0003]然而激活更灵敏,也意味着误激活也更易发生。误激活是指用户没有主动操作时,内部或者外部噪声激发远场语音作出了错误响应,干扰了用户正常使用的现象。
[0004]目前,现有技术中针对误激活问题的解决思路主要有两种方式:
[0005](1)激活模型的升级优化:
[0006]通过持续收集误激活音频,逐一甄别后贴上标签,打包成数据集,让本地声学模型进行学习。该方案存在以下问题:其一是周期长,人力成本高;其二是声音环境千变万化,不可能将所有的声音做标注,让机器学习;其三是模型需要持续升级,才能保证误激活长期在一个低水平。
[0007](2)
【技术保护点】
【技术特征摘要】
1.一种降低远场语音误激活的方法,应用于具有远场语音功能的智能设备,其特征在于,所述智能设备云端ASR语音识别服务器通信,所述降低远场语音误激活的方法包括:智能设备的拾音前端拾取激活音频;利用部署在智能设备本地的激活声学模型对激活音频的声学特征进行检测,获得第一检测结果,并将激活音频打包通过网络上传至云端ASR语音识别服务器进行激活词检测,获得第二检测结果并反馈给智能设备;智能设备根据所述第一检测结果和第二检测结果综合判断是否响应所述激活音频。2.如权利要求1所述的一种降低远场语音误激活的方法,其特征在于,所述利用部署在智能设备本地的激活声学模型对激活音频的声学特征进行检测,获得第一检测结果,具体包括:激活声学模型将激活音频的声学特征与满足激活条件的声学特征进行特征匹配,将特征匹配的结果作为第一检测结果。3.如权利要求1或2所述的一种降低远场语音误激活的方法,其特征在于,所述将激活音频打包通过网络上传至云端ASR语音识别服务器进行激活词检测,获得第二检测结果,具体包括:云端ASR语音识别服务器对收到的激活音频转换为文本内容,并将文本内容同预设的激活词进行匹配,将与激活词的匹配结果作为第二检测结果。4.如权利要求3所述的一种降低远场语音误激活的方法,其特征在于,所述将文本内容同预设的激活词进行匹配,包括:判断文本内容与预设的激活词之间的匹配度是否达到设置的匹配度阈值,所述匹配度阈值根据实际需求设置。5....
【专利技术属性】
技术研发人员:雷伟,
申请(专利权)人:四川长虹电器股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。