一种唤醒门限设置方法、装置、智能音箱及存储介质制造方法及图纸

技术编号:23346452 阅读:28 留言:0更新日期:2020-02-15 04:55
本发明专利技术公开了一种唤醒门限设置方法、装置、智能音箱及存储介质。本发明专利技术中,统计用户声音信号出现在每个预设的声源角度区域内的概率;根据预设唤醒门限值和每个预设的声源角度区域内出现用户声音信号的概率确定每个预设的声源角度区域的唤醒门限值。语音交互设备通常放置在家庭中的固定位置,用户声音信号通常出现在某些固定的角度区域内,根据用户声音信号出现在每个预设的声源角度区域内的概率调整唤醒门限值,使得出现用户声音信号概率较高的角度区域的唤醒门限值低,出现用户声音信号概率较低的角度区域的唤醒门限值高,降低用户声音信号的唤醒门槛,提高非用户声音信号的唤醒门槛,从而兼顾较高的唤醒率和较低的误唤醒率,提升用户体验。

A method, device, intelligent speaker and storage medium for setting wake-up threshold

【技术实现步骤摘要】
一种唤醒门限设置方法、装置、智能音箱及存储介质
本专利技术涉及语音识别
,特别是涉及一种唤醒门限设置方法、装置、智能音箱及存储介质。
技术介绍
随着科技的发展,越来越多的家庭中开始使用具有语音识别功能的语音交互设备,如智能音箱等。在家庭中,语音交互设备通常会拾取到来自电视机或墙面反射的声音,这些非用户期望的声音通常会造成语音交互设备被误唤醒。为了避免语音交互设备被误唤醒,通常会调整唤醒门限,通过提高唤醒门限从而降低误唤醒率,但也同时降低了唤醒率,即同时带来了用户难以唤醒语音交互设备的问题。因此现有的解决语音交互设备被误唤醒的方法无法兼顾较高的唤醒率和较低的误唤醒率,造成用户体验差的问题。
技术实现思路
本专利技术主要提供一种唤醒门限设置方法,能够克服现有的解决语音交互设备被误唤醒的方法无法兼顾较高的唤醒率和较低的误唤醒率,造成用户体验差的问题。为解决上述技术问题,本专利技术采用的一个技术方案是:提供一种唤醒门限设置方法,所述唤醒门限设置方法应用于语音交互设备,所述唤醒门限设置方法包括:每当拾取到用户声音信号时,对所述用户声音信号进行语音识别,并确定所述用户声音信号所属的声源角度区域;对语音识别成功的次数进行计数,以及根据每次所述语音识别成功时所确定的所述用户声音信号所属的声源角度区域,对每个预设的声源角度区域内出现用户声音信号的次数进行计数;判断所述语音识别成功的次数是否达到预设次数,若是,则根据所述语音识别成功的次数以及每个所述预设的声源角度区域内出现用户声音信号的次数计算每个所述预设的声源角度区域内出现用户声音信号的概率;根据预设唤醒门限值和每个所述预设的声源角度区域内出现用户声音信号的概率确定每个所述预设的声源角度区域所对应的唤醒门限值。优选地,所述根据预设唤醒门限值和每个所述预设的声源角度区域内出现用户声音信号的概率确定每个所述预设的声源角度区域所对应的唤醒门限值的步骤具体包括:根据预设唤醒门限值、每个所述预设的声源角度区域内出现用户声音信号的概率及唤醒门限值计算公式确定每个所述预设的声源角度区域所对应的唤醒门限值;所述唤醒门限值计算公式为:其中,Fn为每个所述预设的声源角度区域所对应的唤醒门限值;F0为预设唤醒门限值;Fmax为预设最大唤醒门限值;An为每个所述预设的声源角度区域内出现用户声音信号的概率。优选地,所述唤醒门限设置方法还包括:预先将360°声源角度范围划分为36个声源角度区域,其中,每10°为一个声源角度区域。优选地,所述确定所述用户声音信号所属的声源角度区域的步骤具体包括:根据基于高分辨率谱估计的定位算法或基于波束形成的定位算法或基于到达时间差的定位算法,确定所述用户声音信号所属的声源角度;根据所述声源角度和预先划分的声源角度区域确定所述用户声音信号所属的声源角度区域。优选地,所述语音识别成功具体包括:对所述用户声音信号进行语音识别,并根据所述语音识别结果执行完成相应操作,则所述语音识别成功。优选地,所述根据所述语音识别成功的次数以及每个所述预设的声源角度区域内出现用户声音信号的次数计算每个所述预设的声源角度区域内出现用户声音信号的概率的步骤具体包括:计算每个所述预设的声源角度区域内出现用户声音信号的次数与所述语音识别成功的次数的比值;所述比值为每个所述预设的声源角度区域内出现用户声音信号的概率。优选地,所述语音交互设备中设置有重力传感器;当所述重力传感器检测到X轴、Y轴或Z轴的数据变化值超过预设阈值时,重新确定每个所述预设的声源角度区域内出现用户声音信号的概率;根据重新确定的每个所述预设的声源角度区域内出现用户声音信号的概率重新确定每个所述预设的声源角度区域所对应的唤醒门限值。为解决上述技术问题,本专利技术采用的另一个技术方案是:提供一种唤醒门限设置装置,所述唤醒门限设置装置包括:语音识别模块,用于每当拾取到用户声音信号时,对所述用户声音信号进行语音识别,并确定所述用户声音信号所属的声源角度区域;计数模块,用于对语音识别成功的次数进行计数,以及根据每次所述语音识别成功时所确定的所述用户声音信号所属的声源角度区域,对每个预设的声源角度区域内出现用户声音信号的次数进行计数;概率统计模块,用于判断所述语音识别成功的次数是否达到预设次数,若是,则根据所述语音识别成功的次数以及每个所述预设的声源角度区域内出现用户声音信号的次数计算每个所述预设的声源角度区域内出现用户声音信号的概率;唤醒门限设置模块,用于根据预设唤醒门限值和每个所述预设的声源角度区域内出现用户声音信号的概率确定每个所述预设的声源角度区域所对应的唤醒门限值。为解决上述技术问题,本专利技术采用的另一个技术方案是:提供一种智能音箱,所述智能音箱包括处理器以及存储器,所述处理器耦合所述存储器,所述处理器在工作时执行指令以实现上述的唤醒门限设置方法。为解决上述技术问题,本专利技术采用的另一个技术方案是:提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现上述的唤醒门限设置方法。本专利技术的有益效果是:区别于现有技术的情况,本专利技术中,统计用户声音信号出现在每个预设的声源角度区域内的概率;进而根据预设唤醒门限值和每个预设的声源角度区域内出现用户声音信号的概率确定每个预设的声源角度区域的唤醒门限值。语音交互设备通常放置在家庭中的固定位置,用户声音信号通常出现在某些固定的角度区域内,根据用户声音信号出现在每个预设的声源角度区域内的概率调整唤醒门限值,使得出现用户声音信号概率较高的声源角度区域的唤醒门限值低,出现用户声音信号概率较低的声源角度区域的唤醒门限值较高,降低用户声音信号的唤醒门槛,提高非用户声音信号的唤醒门槛,从而可兼顾较高的唤醒率和较低的误唤醒率,提升用户体验。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,其中:图1是本专利技术一实施例提供的唤醒门限设置方法的流程图;图2是本专利技术另一实施例提供的唤醒门限设置装置的结构示意图;图3是本专利技术另一实施例提供的智能音箱的结构示意图;图4是本专利技术另一实施例提供的存储介质的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一图1为本专利技术一实施例提供的唤醒门限设置方法的流程图,唤醒门限设置方法应用于语音交互设备,语音交互设备可为智能音箱或带有语音交互功能的设本文档来自技高网...

【技术保护点】
1.一种唤醒门限设置方法,其特征在于,所述唤醒门限设置方法应用于语音交互设备,所述唤醒门限设置方法包括:/n每当拾取到用户声音信号时,对所述用户声音信号进行语音识别,并确定所述用户声音信号所属的声源角度区域;/n对语音识别成功的次数进行计数,以及根据每次所述语音识别成功时所确定的所述用户声音信号所属的声源角度区域,对每个预设的声源角度区域内出现用户声音信号的次数进行计数;/n判断所述语音识别成功的次数是否达到预设次数,若是,则根据所述语音识别成功的次数以及每个所述预设的声源角度区域内出现用户声音信号的次数计算每个所述预设的声源角度区域内出现用户声音信号的概率;/n根据预设唤醒门限值和每个所述预设的声源角度区域内出现用户声音信号的概率确定每个所述预设的声源角度区域所对应的唤醒门限值。/n

【技术特征摘要】
1.一种唤醒门限设置方法,其特征在于,所述唤醒门限设置方法应用于语音交互设备,所述唤醒门限设置方法包括:
每当拾取到用户声音信号时,对所述用户声音信号进行语音识别,并确定所述用户声音信号所属的声源角度区域;
对语音识别成功的次数进行计数,以及根据每次所述语音识别成功时所确定的所述用户声音信号所属的声源角度区域,对每个预设的声源角度区域内出现用户声音信号的次数进行计数;
判断所述语音识别成功的次数是否达到预设次数,若是,则根据所述语音识别成功的次数以及每个所述预设的声源角度区域内出现用户声音信号的次数计算每个所述预设的声源角度区域内出现用户声音信号的概率;
根据预设唤醒门限值和每个所述预设的声源角度区域内出现用户声音信号的概率确定每个所述预设的声源角度区域所对应的唤醒门限值。


2.根据权利要求1所述的唤醒门限设置方法,其特征在于,所述根据预设唤醒门限值和每个所述预设的声源角度区域内出现用户声音信号的概率确定每个所述预设的声源角度区域所对应的唤醒门限值的步骤具体包括:
根据预设唤醒门限值、每个所述预设的声源角度区域内出现用户声音信号的概率及唤醒门限值计算公式确定每个所述预设的声源角度区域所对应的唤醒门限值;所述唤醒门限值计算公式为:



其中,Fn为每个所述预设的声源角度区域所对应的唤醒门限值;F0为预设唤醒门限值;Fmax为预设最大唤醒门限值;An为每个所述预设的声源角度区域内出现用户声音信号的概率。


3.根据权利要求1所述的唤醒门限设置方法,其特征在于,所述唤醒门限设置方法还包括:
预先将360°声源角度范围划分为36个声源角度区域,其中,每10°为一个声源角度区域。


4.根据权利要求3所述的唤醒门限设置方法,其特征在于,所述确定所述用户声音信号所属的声源角度区域的步骤具体包括:
根据基于高分辨率谱估计的定位算法或基于波束形成的定位算法或基于到达时间差的定位算法,确定所述用户声音信号所属的声源角度;
根据所述声源角度和预先划分的声源角度区域确定所述用户声音信号所属的声源角度区域。


5.根据权利要求1所述的唤醒门限设置方法,其特征在于,所述语音识别成功具体包括:
对所...

【专利技术属性】
技术研发人员:凌华东
申请(专利权)人:星络智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1