一种声源定位方法、装置、智能音箱及存储介质制造方法及图纸

技术编号:23341197 阅读:23 留言:0更新日期:2020-02-15 03:12
本发明专利技术公开了一种声源定位方法、装置、智能音箱及存储介质。本发明专利技术中,首先通过多次拾取用户声音信号,并对用户声音信号进行成功识别,统计获取用户声音信号出现在每个预设的声源角度区域内的概率;当再次拾取到用户声音信号时,基于声源定位算法获取用户声音信号在多个角度的声源定位计算结果,根据多个角度的声源定位计算结果以及每个预设的声源角度区域内出现用户声音信号的概率确定所述用户声音信号的声源角度。本发明专利技术中将用户声音信号出现在每个预设的声源角度区域内的概率考虑进声源定位中,可以避免来自特定角度区域的电视机声音或墙面反射的声音对语音识别的影响,提升语音识别准确率。

A sound source location method, device, intelligent speaker and storage medium

【技术实现步骤摘要】
一种声源定位方法、装置、智能音箱及存储介质
本专利技术涉及语音识别
,特别是涉及一种声源定位方法、装置、智能音箱及存储介质。
技术介绍
随着科技的发展,越来越多的家庭中开始使用具有语音识别功能的智能音箱设备,在家庭中,用户通常会将智能音箱放置在电视柜上电视机旁,或者放置在靠墙位置,当智能音箱放置在上述位置,用户与智能音箱进行语音交互时,由于电视声音的影响或墙面对用户声音的反射,造成智能音箱不能准确地定位用户声源,进而无法进行准确地语音识别,影响语音识别准确率。
技术实现思路
本专利技术主要提供一种声源定位方法,能够克服现有的智能音箱因放置在电视机旁或墙面附近,受电视机声音或墙面对声音反射的影响,导致无法准确定位用户声源,影响语音识别的问题。为解决上述技术问题,本专利技术采用的一个技术方案是:提供一种声源定位方法,所述声源定位方法应用于语音交互设备,所述声源定位方法包括:每当拾取到用户声音信号时,对所述用户声音信号进行语音识别,并确定所述用户声音信号所属的声源角度区域;对语音识别成功的次数进行计数,以及根据每次所述语音识别成功时所确定的所述用户声音信号所属的声源角度区域,对每个预设的声源角度区域内出现用户声音信号的次数进行计数;判断所述语音识别成功的次数是否达到预设次数,若是,则根据所述语音识别成功的次数以及每个所述预设的声源角度区域内出现用户声音信号的次数计算每个所述预设的声源角度区域内出现用户声音信号的概率;当再次拾取到用户声音信号时,基于声源定位算法获取所述用户声音信号在多个角度的声源定位计算结果,根据多个角度的所述声源定位计算结果以及每个所述预设的声源角度区域内出现用户声音信号的概率确定所述用户声音信号的声源角度。优选地,所述声源定位方法还包括:预先将360°声源角度范围划分为36个声源角度区域,其中,每10°为一个声源角度区域。优选地,确定所述用户声音信号所属的声源角度区域的步骤具体包括:根据基于高分辨率谱估计的定位算法或基于波束形成的定位算法或基于到达时间差的定位算法,确定所述用户声音信号所属的声源角度;根据所述声源角度和预先划分的声源角度区域确定所述用户声音信号所属的声源角度区域。优选地,所述语音识别成功具体包括:对所述用户声音信号进行语音识别,并根据所述语音识别结果执行完成相应操作,则所述语音识别成功。优选地,所述根据所述语音识别成功的次数以及每个所述预设的声源角度区域内出现用户声音信号的次数计算每个所述预设的声源角度区域内出现用户声音信号的概率的步骤具体包括:计算每个所述预设的声源角度区域内出现用户声音信号的次数与所述语音识别成功的次数的比值;所述比值为每个所述预设的声源角度区域内出现用户声音信号的概率。优选地,所述获取所述用户声音信号在多个角度的声源定位计算结果,根据多个角度的所述声源定位计算结果以及每个所述预设的声源角度区域内出现用户声音信号的概率确定所述用户声音信号的声源角度的步骤具体包括:根据基于高分辨率谱估计的定位算法获取所述用户声音信号在多个角度的谱函数的峰值;根据每个所述角度所属的声源角度区域和每个所述预设的声源角度区域内出现用户声音信号的概率获取每个所述角度所对应的出现用户声音信号的概率;计算每个所述角度的谱函数峰值与每个所述角度所对应的出现用户声音信号的概率的乘积,将乘积最大值所对应的角度确定为所述用户声音信号的声源角度。优选地,所述获取所述用户声音信号在多个角度的声源定位计算结果,根据多个角度的所述声源定位计算结果以及每个所述预设的声源角度区域内出现用户声音信号的概率确定所述用户声音信号的声源角度的步骤具体包括:根据基于波束形成的定位算法获取所述用户声音信号在多个角度的功率值;根据每个所述角度所属的声源角度区域和每个所述预设的声源角度区域内出现用户声音信号的概率获取每个所述角度所对应的出现用户声音信号的概率;计算每个所述角度的功率值与每个所述角度所对应的出现用户声音信号的概率的乘积,将乘积最大值所对应的角度确定为所述用户声音信号的声源角度。优选地,所述获取所述用户声音信号在多个角度的声源定位计算结果,根据多个角度的所述声源定位计算结果以及每个所述预设的声源角度区域内出现用户声音信号的概率确定所述用户声音信号的声源角度的步骤具体包括:基于到达时间差的定位算法计算多个角度分别对应的时延差,并根据每个角度所对应的所述时延差计算距离差;根据每个所述角度所属的声源角度区域和每个所述预设的声源角度区域内出现用户声音信号的概率获取每个所述角度所对应的出现用户声音信号的概率;将每个所述角度所对应的距离差除以每个所述角度所对应的出现用户声音信号的概率得到每个所述角度重新确定的距离差;根据每个所述角度重新确定的距离差以及麦克风阵列的空间几何位置确定用户声音信号的声源角度。优选地,所述语音交互设备中设置有重力传感器,当所述重力传感器检测到X轴、Y轴或Z轴的数据变化值超过预设阈值时,重新确定每个所述预设的声源角度区域内出现用户声音信号的概率。为解决上述技术问题,本专利技术采用的另一个技术方案是:提供一种声源定位装置,所述声源定位装置包括:语音识别模块,用于每当拾取到用户声音信号时,对所述用户声音信号进行语音识别,并确定所述用户声音信号所属的声源角度区域;计数模块,用于对语音识别成功的次数进行计数,以及根据每次所述语音识别成功时所确定的所述用户声音信号所属的声源角度区域,对每个预设的声源角度区域内出现用户声音信号的次数进行计数;概率统计模块,用于判断所述语音识别成功的次数是否达到预设次数,若是,则根据所述语音识别成功的次数以及每个所述预设的声源角度区域内出现用户声音信号的次数计算每个所述预设的声源角度区域内出现用户声音信号的概率;声源角度定位模块,用于当再次拾取到用户声音信号时,基于声源定位算法获取所述用户声音信号在多个角度的声源定位计算结果,根据多个角度的所述声源定位计算结果以及每个所述预设的声源角度区域内出现用户声音信号的概率确定所述用户声音信号的声源角度。为解决上述技术问题,本专利技术采用的另一个技术方案是:提供一种智能音箱,所述智能音箱包括处理器以及存储器,所述处理器耦合所述存储器,所述处理器在工作时执行指令以实现上述的声源定位方法。为解决上述技术问题,本专利技术采用的另一个技术方案是:提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现上述的声源定位方法。本专利技术的有益效果是:区别于现有技术的情况,本专利技术中首先通过多次拾取用户声音信号,并对用户声音信号进行成功识别,统计获取用户声音信号出现在每个预设的声源角度区域内的概率;当再次拾取到用户声音信号时,基于声源定位算法获取用户声音信号在多个角度的声源定位计算结果,根据多个角度的声源定位计算结果以及每个预设的声源角度区域内出现用户声音信号的概率确定所述用户声音信号的声源角度本文档来自技高网...

【技术保护点】
1.一种声源定位方法,其特征在于,所述声源定位方法应用于语音交互设备,所述声源定位方法包括:/n每当拾取到用户声音信号时,对所述用户声音信号进行语音识别,并确定所述用户声音信号所属的声源角度区域;/n对语音识别成功的次数进行计数,以及根据每次所述语音识别成功时所确定的所述用户声音信号所属的声源角度区域,对每个预设的声源角度区域内出现用户声音信号的次数进行计数;/n判断所述语音识别成功的次数是否达到预设次数,若是,则根据所述语音识别成功的次数以及每个所述预设的声源角度区域内出现用户声音信号的次数计算每个所述预设的声源角度区域内出现用户声音信号的概率;/n当再次拾取到用户声音信号时,基于声源定位算法获取所述用户声音信号在多个角度的声源定位计算结果,根据多个角度的所述声源定位计算结果以及每个所述预设的声源角度区域内出现用户声音信号的概率确定所述用户声音信号的声源角度。/n

【技术特征摘要】
1.一种声源定位方法,其特征在于,所述声源定位方法应用于语音交互设备,所述声源定位方法包括:
每当拾取到用户声音信号时,对所述用户声音信号进行语音识别,并确定所述用户声音信号所属的声源角度区域;
对语音识别成功的次数进行计数,以及根据每次所述语音识别成功时所确定的所述用户声音信号所属的声源角度区域,对每个预设的声源角度区域内出现用户声音信号的次数进行计数;
判断所述语音识别成功的次数是否达到预设次数,若是,则根据所述语音识别成功的次数以及每个所述预设的声源角度区域内出现用户声音信号的次数计算每个所述预设的声源角度区域内出现用户声音信号的概率;
当再次拾取到用户声音信号时,基于声源定位算法获取所述用户声音信号在多个角度的声源定位计算结果,根据多个角度的所述声源定位计算结果以及每个所述预设的声源角度区域内出现用户声音信号的概率确定所述用户声音信号的声源角度。


2.根据权利要求1所述的声源定位方法,其特征在于,所述声源定位方法还包括:
预先将360°声源角度范围划分为36个声源角度区域,其中,每10°为一个声源角度区域。


3.根据权利要求2所述的声源定位方法,其特征在于,确定所述用户声音信号所属的声源角度区域的步骤具体包括:
根据基于高分辨率谱估计的定位算法或基于波束形成的定位算法或基于到达时间差的定位算法,确定所述用户声音信号所属的声源角度;
根据所述声源角度和预先划分的声源角度区域确定所述用户声音信号所属的声源角度区域。


4.根据权利要求1所述的声源定位方法,其特征在于,所述语音识别成功具体包括:
对所述用户声音信号进行语音识别,并根据所述语音识别结果执行完成相应操作,则所述语音识别成功。


5.根据权利要求1所述的声源定位方法,其特征在于,所述根据所述语音识别成功的次数以及每个所述预设的声源角度区域内出现用户声音信号的次数计算每个所述预设的声源角度区域内出现用户声音信号的概率的步骤具体包括:
计算每个所述预设的声源角度区域内出现用户声音信号的次数与所述语音识别成功的次数的比值;
所述比值为每个所述预设的声源角度区域内出现用户声音信号的概率。


6.根据权利要求1所述的声源定位方法,其特征在于,所述获取所述用户声音信号在多个角度的声源定位计算结果,根据多个角度的所述声源定位计算结果以及每个所述预设的声源角度区域内出现用户声音信号的概率确定所述用户声音信号的声源角度的步骤具体包括:
根据基于高分辨率谱估计的定位算法获取所述用户声音信号在多个角度的谱函数的峰值;
根据每个所述角度所属的声源角度区域和每个所述预设的声源角度区域内出现用户声音信号的概率获取每个所述角度所对应的出现用户声音信号的概率;
计算每个所述角度的谱函数峰值与每个所述角度所对应的出现用户声音信号的概率的乘积,将乘积最大值所对应的角度确定为所述用户声音信号的声源角度。


7.根据权利要求1所述的声源定位方法,其特征在于,所述获取所述用户声音信号在多个角...

【专利技术属性】
技术研发人员:凌华东
申请(专利权)人:星络智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1