一种沉浸式语音交互方法及系统技术方案

技术编号:29335483 阅读:27 留言:0更新日期:2021-07-20 17:53
本申请提供了一种沉浸式语音交互方法及系统,具体的,在预设交互空间内布设用户定位装置和多个语音交互装置。根据用户定位装置所获取的目标用户在该交互空间中的位置数据、以及布设的各语音交互装置的位置数据,分别计算所述目标用户与各所述语音交互装置之间的距离,选取其中的一个语音交互装置,对该目标用户进行语音采集,这样,用户便可以不再受单个语音交互装置的拾音距离限制,实现用户在预设交互空间的任意位置的语音交互,并且,通过用户定位装置对用户的实时定位,可以实现通过切换语音交互装置对用户进行语音采集,进而可为用户营造沉浸式的语音交互体验。另外,若上述语音交互装置为音频播放装置,进而可以为用户提供更佳的听觉效果。

【技术实现步骤摘要】
一种沉浸式语音交互方法及系统
本申请涉及智能家居
,尤其涉及一种沉浸式语音交互方法及系统。
技术介绍
随着智能家居的快速发展,智能家居设备的种类也越来越多样化,比如,智能照明设备、智能电视、智能冰箱以及智能空调等等。在使用该类智能家居设备的过程中,为方便操作,用户可以通过语音来控制该类智能家居设备。比如,用户可以通过语音“打开电视”来控制智能电视的打开。在现有技术中,用户通过语音来控制智能家居设备的方法主要为:设置一个语音采集设备,并且,该语音采集设备通过智能家居网关与智能家居设备建立网络连接。在使用过程中,首先,利用语音采集设备来采集用户的语音信息,然后,由智能家居网关对该语音信息进行识别,并生成控制指令,该控制指令用于指示智能家居设备执行相应的操作,然后,智能家居网关根据用户欲控制的目标智能家居设备,将控制指令发送至目标智能家居设备,以控制其执行相应的动作。但是,由于语音采集设备的拾音距离有限,所以,当部署场景范围大的情况下,设置一个语音采集设备,无法满足用户在任意位置进行语音交互的需求。
技术实现思路
本申请实施例提供了一种沉浸式语音交互方法及系统,以实现用户在部署场景的任意位置的语音交互。根据本申请实施例的第一方面,提供了一种沉浸式语音交互方法,该方法主要用于采集用户的语音数据,主要包括如下步骤:利用用户定位装置,获取目标用户在交互空间中的位置数据;根据所述目标用户的位置数据、所述交互空间中所布设的拾音装置的位置数据,分别计算所述目标用户与各所述拾音装置之间的距离;根据所述目标用户与各所述拾音装置之间的距离,从各所述拾音装置中选择一个拾音装置作为第一目标拾音装置;利用所述第一目标拾音装置,对所述目标用户进行语音采集。根据本申请实施例的第二方面,提供了另一种沉浸式语音交互方法,该方法主要用于向用户播放音频数据,主要包括如下步骤:利用用户定位装置,获取目标用户在交互空间中的位置数据;根据所述目标用户的位置数据、所述交互空间中所布设的音频播放装置的位置数据,分别计算所述目标用户与各所述音频播放装置之间的距离;根据所述目标用户与各所述音频播放装置之间的距离,从各所述音频播放装置中选择一个音频播放装置作为第一目标音频播放装置;利用所述第一目标音频播放装置,向所述目标用户播放音频数据。根据本申请实施例的第三方面,提供了一种沉浸式语音交互系统,该系统包括:数据处理装置、与所述数据处理装置相连接的用户定位装置和多个拾音装置,其中,所述数据处理装置被配置为执行本申请实施第一方面所述的方法。根据本申请实施例的第四方面,提供了另一种沉浸式语音交互系统,该系统包括:数据处理装置、与所述数据处理装置相连接的用户定位装置和多个音频播放装置,其中,所述数据处理装置被配置为执行本申请实施第二方面所述的方法。由上述实施例可见,本申请实施例提供的沉浸式语音交互方法及系统,在预设交互空间内布设用户定位装置和多个拾音装置。根据用户定位装置所获取的目标用户在该交互空间中的位置数据、以及布设的各拾音装置的位置数据,分别计算所述目标用户与各所述拾音装置之间的距离,选取其中的一个拾音装置,对该目标用户进行语音采集,这样,用户便可以不再受单个拾音装置的拾音距离限制,实现用户在预设交互空间的任意位置的语音交互,并且,通过用户定位装置对用户的实时定位,可以实现通过切换拾音装置对用户进行语音采集,进而可为用户营造沉浸式、无处不在的语音交互体验。另外,基于上述设计方式,本实施例还提供了用于向用户播放音频数据的交互方式,进而可以为用户提供更佳的听觉效果。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种沉浸式语音交互系统的结构示意图;图2为本申请实施例提供的一种沉浸式语音交互方法的基本流程示意图;图3为本申请实施例提供的目标用户在交互空间中的位置计算方法示意图;图4为本申请实施例提供的目标用户与拾音装置之间的距离计算方法示意图;图5为本申请实施例提供的在相邻拾音装置之间设置的预激活区域示意图;图6为本申请实施例提供的另一种沉浸式语音交互方法的基本流程示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1为本申请实施例提供的一种沉浸式语音交互系统的结构示意图。如图1所示,在该系统设有数据处理装置300、与所述数据处理装置300相连接的用户定位装置100和多个拾音装置200,用户定位装置100和多个拾音装置200布设在预设交互空间中,其中,多个拾音装置200可以布设在交互空间中的不同位置。本实施例中,将部署该用户定位装置100和多个拾音装置200的空间称为交互空间,例如,会议室、客厅等均可以称为交互空间。数据处理装置300可以根据用户定位装置100对用户的定位,启用一个拾音装置200,然后,根据启用的拾音装置200所采集的语音数据,控制相应的目标智能家居设备400、如智能电视、空调、音响等等。当然,需要说明的是,本实施例提供的沉浸式语音交互系统不仅适用于智能家居中,即数据处理装置300并不限于控制智能家居设备400,在其他实施例中还可以用于智能教室中控制屏幕投放等应用场景,或者,还可以仅用于用户语音的采集并进行用户语音的存储等。另外,该系统中还可以设置多个音频播放装置,以为用户播放音频数据,其中,音频播放装置和拾音装置在本实施例可以被统称为语音交互装置。基于上述系统,本实施例提供了一种沉浸式语音交互方法。图2为本申请实施例提供的一种沉浸式语音交互方法的基本流程示意图。如图2所示,该方法主要包括如下步骤:S101:利用用户定位装置,获取目标用户在交互空间中的位置数据。其中,本实施例中将在交互空间中发出语音的用户为声源用户,在所述声源用户中所筛选出的可以与该交互系统进行语音交互的用户为目标用户,例如,基于各声源用户的权限有限级别进行目标用户的筛选、和/或基于已构建的语音交互的进程不中断的原则进行目标用户的筛选。对于用户的位置数据,可以在交互空间中构建XYZ三维空间模型,将用户在该三维空间模型中的位置坐标,作为其在该交互空间中的位置数据。当然,可以采用其它标定方法,例如采用极坐标的标定方式。对于用户的定位方式,可以采用机器视觉与声纹识别相结合的方式,例如,利用图像采集装置、测距装置以及声纹识别装置进行用户定位,具体可以包括如下步骤:S1011a:利用本文档来自技高网...

【技术保护点】
1.一种沉浸式语音交互方法,其特征在于,所述方法包括:/n利用用户定位装置,获取目标用户在交互空间中的位置数据;/n根据所述目标用户的位置数据、所述交互空间中所布设的拾音装置的位置数据,分别计算所述目标用户与各所述拾音装置之间的距离;/n根据所述目标用户与各所述拾音装置之间的距离,从各所述拾音装置中选择一个拾音装置作为第一目标拾音装置;/n利用所述第一目标拾音装置,对所述目标用户进行语音采集。/n

【技术特征摘要】
1.一种沉浸式语音交互方法,其特征在于,所述方法包括:
利用用户定位装置,获取目标用户在交互空间中的位置数据;
根据所述目标用户的位置数据、所述交互空间中所布设的拾音装置的位置数据,分别计算所述目标用户与各所述拾音装置之间的距离;
根据所述目标用户与各所述拾音装置之间的距离,从各所述拾音装置中选择一个拾音装置作为第一目标拾音装置;
利用所述第一目标拾音装置,对所述目标用户进行语音采集。


2.根据权利要求1所述的方法,其特征在于,对所述目标用户进行语音采集之后,所述方法还包括:
利用所述用户定位装置,获取所述目标用户在交互空间中的各当前位置数据;
根据所述当前位置数据,判断所述目标用户是否处于预激活区域内,所述预激活区域设置在相邻的拾音装置之间;
如果所述目标用户处于预激活区域内,则根据所述目标用户所处的预激活区域,确定第二目标拾音装置;
向所述第二目标拾音装置发送启动指令,以启动所述第二目标拾音装置。


3.根据权利要求2所述的方法,其特征在于,启动所述第二目标拾音装置之后,所述方法还包括:
根据所述目标用户的当前位置数据,判断所述目标用户是否进入所述第二目标拾音装置的拾音区域内;
如果所述目标用户处于所述第二目标拾音装置的拾音区域内,则利用所述第二目标拾音装置对所述目标用户进行语音采集,向所述第一目标拾音装置发送关闭指令。


4.根据权利要求1所述的方法,其特征在于,利用所述第一目标拾音装置,对所述目标用户进行语音采集,包括:
根据所述用户定位装置所获取的所述目标用户在交互空间中的当前位置数据,调整所述第一目标拾音装置的拾音增强方向;
将所述第一目标拾音装置所采集的所述目标用户的语音信号中,位于所述拾音增强方向的语音信号进行语音增强。


5.根据权利要求1所述的方法,其特征在于,利用用户定位装置,获取目标用户在交互空间中的位置数据,包括:
利用声纹识别装置,识别出所述交互空间中的目标用户;
利用图像采集装置,采集所述交互空间中的用户图像,所述用户图像中包含所述目标用户;
根据所述目标用户在所述用户图像中的位置,利用测距装置,测量所述...

【专利技术属性】
技术研发人员:孟卫明高雪松张淯易陈维强
申请(专利权)人:海信集团有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1