一种唤醒门限设置方法、装置、智能音箱及存储介质制造方法及图纸

技术编号：23346452 阅读：28 留言：0更新日期：2020-02-15 04:55

本发明专利技术公开了一种唤醒门限设置方法、装置、智能音箱及存储介质。本发明专利技术中，统计用户声音信号出现在每个预设的声源角度区域内的概率；根据预设唤醒门限值和每个预设的声源角度区域内出现用户声音信号的概率确定每个预设的声源角度区域的唤醒门限值。语音交互设备通常放置在家庭中的固定位置，用户声音信号通常出现在某些固定的角度区域内，根据用户声音信号出现在每个预设的声源角度区域内的概率调整唤醒门限值，使得出现用户声音信号概率较高的角度区域的唤醒门限值低，出现用户声音信号概率较低的角度区域的唤醒门限值高，降低用户声音信号的唤醒门槛，提高非用户声音信号的唤醒门槛，从而兼顾较高的唤醒率和较低的误唤醒率，提升用户体验。

A method, device, intelligent speaker and storage medium for setting wake-up threshold

全部详细技术资料下载

【技术实现步骤摘要】
一种唤醒门限设置方法、装置、智能音箱及存储介质
本专利技术涉及语音识别
，特别是涉及一种唤醒门限设置方法、装置、智能音箱及存储介质。
技术介绍
随着科技的发展，越来越多的家庭中开始使用具有语音识别功能的语音交互设备，如智能音箱等。在家庭中，语音交互设备通常会拾取到来自电视机或墙面反射的声音，这些非用户期望的声音通常会造成语音交互设备被误唤醒。为了避免语音交互设备被误唤醒，通常会调整唤醒门限，通过提高唤醒门限从而降低误唤醒率，但也同时降低了唤醒率，即同时带来了用户难以唤醒语音交互设备的问题。因此现有的解决语音交互设备被误唤醒的方法无法兼顾较高的唤醒率和较低的误唤醒率，造成用户体验差的问题。
技术实现思路
本专利技术主要提供一种唤醒门限设置方法，能够克服现有的解决语音交互设备被误唤醒的方法无法兼顾较高的唤醒率和较低的误唤醒率，造成用户体验差的问题。为解决上述技术问题，本专利技术采用的一个技术方案是：提供一种唤醒门限设置方法，所述唤醒门限设置方法应用于语音交互设备，所述唤醒门限设置方法包括：每当拾取到用户声音信号时，对所述用户声音信号进行语音识别，并确定所述用户声音信号所属的声源角度区域；对语音识别成功的次数进行计数，以及根据每次所述语音识别成功时所确定的所述用户声音信号所属的声源角度区域，对每个预设的声源角度区域内出现用户声音信号的次数进行计数；判断所述语音识别成功的次数是否达到预设次数，若是，则根据所述语音识别成功的次数以及每个所述预设的声源角度区域内出现用户声...

【技术保护点】
1.一种唤醒门限设置方法，其特征在于，所述唤醒门限设置方法应用于语音交互设备，所述唤醒门限设置方法包括：/n每当拾取到用户声音信号时，对所述用户声音信号进行语音识别，并确定所述用户声音信号所属的声源角度区域；/n对语音识别成功的次数进行计数，以及根据每次所述语音识别成功时所确定的所述用户声音信号所属的声源角度区域，对每个预设的声源角度区域内出现用户声音信号的次数进行计数；/n判断所述语音识别成功的次数是否达到预设次数，若是，则根据所述语音识别成功的次数以及每个所述预设的声源角度区域内出现用户声音信号的次数计算每个所述预设的声源角度区域内出现用户声音信号的概率；/n根据预设唤醒门限值和每个所述预设的声源角度区域内出现用户声音信号的概率确定每个所述预设的声源角度区域所对应的唤醒门限值。/n

【技术特征摘要】
1.一种唤醒门限设置方法，其特征在于，所述唤醒门限设置方法应用于语音交互设备，所述唤醒门限设置方法包括：
每当拾取到用户声音信号时，对所述用户声音信号进行语音识别，并确定所述用户声音信号所属的声源角度区域；
对语音识别成功的次数进行计数，以及根据每次所述语音识别成功时所确定的所述用户声音信号所属的声源角度区域，对每个预设的声源角度区域内出现用户声音信号的次数进行计数；
判断所述语音识别成功的次数是否达到预设次数，若是，则根据所述语音识别成功的次数以及每个所述预设的声源角度区域内出现用户声音信号的次数计算每个所述预设的声源角度区域内出现用户声音信号的概率；
根据预设唤醒门限值和每个所述预设的声源角度区域内出现用户声音信号的概率确定每个所述预设的声源角度区域所对应的唤醒门限值。

2.根据权利要求1所述的唤醒门限设置方法，其特征在于，所述根据预设唤醒门限值和每个所述预设的声源角度区域内出现用户声音信号的概率确定每个所述预设的声源角度区域所对应的唤醒门限值的步骤具体包括：
根据预设唤醒门限值、每个所述预设的声源角度区域内出现用户声音信号的概率及唤醒门限值计算公式确定每个所述预设的声源角度区域所对应的唤醒门限值；所述唤醒门限值计算公式为：

其中，Fn为每个所述预设的声源角度区域所对应的唤醒门限值；F0为预设唤醒门限值；Fmax为预设最大唤醒门限值；An为每个所述预设的声源角度区域内出现用户声音信号的概率。

3.根据权利要求1所述的唤醒门限设置方法，其特征在于，所述唤醒门限设置方法还包括：
预先将360°声源角度范围划分为36个声源角度区域，其中，每10°为一个声源角度区域。

4.根据权利要求3所述的唤醒门限设置方法，其特征在于，所述确定所述用户声音信号所属的声源角度区域的步骤具体包括：
根据基于高分辨率谱估计的定位算法或基于波束形成的定位算法或基于到达时间差的定位算法，确定所述用户声音信号所属的声源角度；
根据所述声源角度和预先划分的声源角度区域确定所述用户声音信号所属的声源角度区域。

5.根据权利要求1所述的唤醒门限设置方法，其特征在于，所述语音识别成功具体包括：
对所...

【专利技术属性】
技术研发人员：凌华东，
申请(专利权)人：星络智能科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人