一种声源定位方法、装置、智能音箱及存储介质制造方法及图纸

技术编号：23341197 阅读：23 留言：0更新日期：2020-02-15 03:12

本发明专利技术公开了一种声源定位方法、装置、智能音箱及存储介质。本发明专利技术中，首先通过多次拾取用户声音信号，并对用户声音信号进行成功识别，统计获取用户声音信号出现在每个预设的声源角度区域内的概率；当再次拾取到用户声音信号时，基于声源定位算法获取用户声音信号在多个角度的声源定位计算结果，根据多个角度的声源定位计算结果以及每个预设的声源角度区域内出现用户声音信号的概率确定所述用户声音信号的声源角度。本发明专利技术中将用户声音信号出现在每个预设的声源角度区域内的概率考虑进声源定位中，可以避免来自特定角度区域的电视机声音或墙面反射的声音对语音识别的影响，提升语音识别准确率。

A sound source location method, device, intelligent speaker and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
一种声源定位方法、装置、智能音箱及存储介质
本专利技术涉及语音识别
，特别是涉及一种声源定位方法、装置、智能音箱及存储介质。
技术介绍
随着科技的发展，越来越多的家庭中开始使用具有语音识别功能的智能音箱设备，在家庭中，用户通常会将智能音箱放置在电视柜上电视机旁，或者放置在靠墙位置，当智能音箱放置在上述位置，用户与智能音箱进行语音交互时，由于电视声音的影响或墙面对用户声音的反射，造成智能音箱不能准确地定位用户声源，进而无法进行准确地语音识别，影响语音识别准确率。
技术实现思路
本专利技术主要提供一种声源定位方法，能够克服现有的智能音箱因放置在电视机旁或墙面附近，受电视机声音或墙面对声音反射的影响，导致无法准确定位用户声源，影响语音识别的问题。为解决上述技术问题，本专利技术采用的一个技术方案是：提供一种声源定位方法，所述声源定位方法应用于语音交互设备，所述声源定位方法包括：每当拾取到用户声音信号时，对所述用户声音信号进行语音识别，并确定所述用户声音信号所属的声源角度区域；对语音识别成功的次数进行计数，以及根据每次所述语音识别成功时所确定的所述用户声音信号所属的声源角度区域，对每个预设的声源角度区域内出现用户声音信号的次数进行计数；判断所述语音识别成功的次数是否达到预设次数，若是，则根据所述语音识别成功的次数以及每个所述预设的声源角度区域内出现用户声音信号的次数计算每个所述预设的声源角度区域内出现用户声音信号的概率；当再次拾取到用户声音信号时，基于声源定位算...

【技术保护点】
1.一种声源定位方法，其特征在于，所述声源定位方法应用于语音交互设备，所述声源定位方法包括：/n每当拾取到用户声音信号时，对所述用户声音信号进行语音识别，并确定所述用户声音信号所属的声源角度区域；/n对语音识别成功的次数进行计数，以及根据每次所述语音识别成功时所确定的所述用户声音信号所属的声源角度区域，对每个预设的声源角度区域内出现用户声音信号的次数进行计数；/n判断所述语音识别成功的次数是否达到预设次数，若是，则根据所述语音识别成功的次数以及每个所述预设的声源角度区域内出现用户声音信号的次数计算每个所述预设的声源角度区域内出现用户声音信号的概率；/n当再次拾取到用户声音信号时，基于声源定位算法获取所述用户声音信号在多个角度的声源定位计算结果，根据多个角度的所述声源定位计算结果以及每个所述预设的声源角度区域内出现用户声音信号的概率确定所述用户声音信号的声源角度。/n

【技术特征摘要】
1.一种声源定位方法，其特征在于，所述声源定位方法应用于语音交互设备，所述声源定位方法包括：
每当拾取到用户声音信号时，对所述用户声音信号进行语音识别，并确定所述用户声音信号所属的声源角度区域；
对语音识别成功的次数进行计数，以及根据每次所述语音识别成功时所确定的所述用户声音信号所属的声源角度区域，对每个预设的声源角度区域内出现用户声音信号的次数进行计数；
判断所述语音识别成功的次数是否达到预设次数，若是，则根据所述语音识别成功的次数以及每个所述预设的声源角度区域内出现用户声音信号的次数计算每个所述预设的声源角度区域内出现用户声音信号的概率；
当再次拾取到用户声音信号时，基于声源定位算法获取所述用户声音信号在多个角度的声源定位计算结果，根据多个角度的所述声源定位计算结果以及每个所述预设的声源角度区域内出现用户声音信号的概率确定所述用户声音信号的声源角度。

2.根据权利要求1所述的声源定位方法，其特征在于，所述声源定位方法还包括：
预先将360°声源角度范围划分为36个声源角度区域，其中，每10°为一个声源角度区域。

3.根据权利要求2所述的声源定位方法，其特征在于，确定所述用户声音信号所属的声源角度区域的步骤具体包括：
根据基于高分辨率谱估计的定位算法或基于波束形成的定位算法或基于到达时间差的定位算法，确定所述用户声音信号所属的声源角度；
根据所述声源角度和预先划分的声源角度区域确定所述用户声音信号所属的声源角度区域。

4.根据权利要求1所述的声源定位方法，其特征在于，所述语音识别成功具体包括：
对所述用户声音信号进行语音识别，并根据所述语音识别结果执行完成相应操作，则所述语音识别成功。

5.根据权利要求1所述的声源定位方法，其特征在于，所述根据所述语音识别成功的次数以及每个所述预设的声源角度区域内出现用户声音信号的次数计算每个所述预设的声源角度区域内出现用户声音信号的概率的步骤具体包括：
计算每个所述预设的声源角度区域内出现用户声音信号的次数与所述语音识别成功的次数的比值；
所述比值为每个所述预设的声源角度区域内出现用户声音信号的概率。

6.根据权利要求1所述的声源定位方法，其特征在于，所述获取所述用户声音信号在多个角度的声源定位计算结果，根据多个角度的所述声源定位计算结果以及每个所述预设的声源角度区域内出现用户声音信号的概率确定所述用户声音信号的声源角度的步骤具体包括：
根据基于高分辨率谱估计的定位算法获取所述用户声音信号在多个角度的谱函数的峰值；
根据每个所述角度所属的声源角度区域和每个所述预设的声源角度区域内出现用户声音信号的概率获取每个所述角度所对应的出现用户声音信号的概率；
计算每个所述角度的谱函数峰值与每个所述角度所对应的出现用户声音信号的概率的乘积，将乘积最大值所对应的角度确定为所述用户声音信号的声源角度。

7.根据权利要求1所述的声源定位方法，其特征在于，所述获取所述用户声音信号在多个角...

【专利技术属性】
技术研发人员：凌华东，
申请(专利权)人：星络智能科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人