语音交互系统、方法、设备和会议系统技术方案

技术编号:30341342 阅读:30 留言:0更新日期:2021-10-12 23:11
提出了一种语音交互系统、设备、方法及其相应的会议系统。所述语音交互系统,包括多个相互通信的语音设备,其中,所述语音设备具有远场语音交互功能并且用于进行语音交互;其中,所述多个语音设备基于预定仲裁规则,选择其中的一个语音设备与用户进行当前语音交互。本发明专利技术的语音交互方案可以通过基于用户实时状态的多端仲裁实现多个语音设备的动态选择。具体地,可以通过就近应答等原则确定最适于与用户交互的设备,由此提升为用户提供语音服务的准确性和易用性。的准确性和易用性。的准确性和易用性。

【技术实现步骤摘要】
语音交互系统、方法、设备和会议系统


[0001]本专利技术涉及信息
,尤其涉及一种语音交互系统、方法、设备和会议系统。

技术介绍

[0002]随着语音交互技术的发展,越来越多的用户配备了智能语音交互终端(例如,智能音箱)作为家中的智能交互中心。智能音箱是音箱和网络技术升级的产物,可以用作家庭消费者用语音上网的工具。智能音箱可以进行点播歌曲、上网购物,或是了解天气预报的操作,也可以对智能家居设备进行控制,比如打开窗帘、设置冰箱温度、提前让热水器升温等。
[0003]虽然语音交互终端通常采用远场拾音技术使得其能够接收3-5m范围之外的语音输入,但上述远场拾音通常无法覆盖较大交互空间内的所有位置,尤其是考虑到房间门、墙壁和上下楼等阻隔,以及会议室场景等的情况时。为了提升语音交互的可达性,可以考虑在家中布置多个语音交互终端。而在存在多个语音交互终端时,如何恰当选择终端与用户交互成为了本领域需要解决的一个问题。

技术实现思路

[0004]为了解决如上至少一个问题,本专利技术提出了一种新的语音解决方案,该方案中可以配备多个具备远场语音交互功能的语音设备,这多个语音设备基于预定的仲裁规则选择要与用户进行语音交互的设备,由此方便用户对语音设备的使用,并提升语音交互系统整体的触达率。
[0005]根据本专利技术的第一方面,提出了一种语音交互系统,包括多个相互通信的语音设备,其中,所述语音设备具有远场语音交互功能并且用于进行语音交互;其中,所述多个语音设备基于预定的仲裁规则,选择其中的一个语音设备与用户进行当前语音交互。
[0006]上述系统尤其适用于会议场景。为此,根据本专利技术的第二方面,提出了一种语音会议系统,包括多个相互通信的语音设备,其中,所述语音设备具有远场语音交互功能并且用于进行语音交互;其中,所述多个语音设备基于预定的仲裁规则,选择其中的一个语音设备与用户进行当前语音交互,所述当前语音交互用于如下至少一项:进行会议通话;以及进行智能语音交互。
[0007]根据本专利技术的第三方面,提出了一种语音设备,与至少一个其他语音设备通信,其中,所述语音设备包括:交互单元,用于与用户进行语音交互;以及通信单元,用于与所述至少一个其他语音设备通信;仲裁单元,用于基于预定的仲裁规则,从所述语音设备和至少一个其他语音设备中动态选择与所述用户进行当前语音交互的一个语音设备。
[0008]根据本专利技术的第四方面,提出了一种语音交互方法,包括:采集用户的语音输入信息;基于采集到的语音数据信息,与相互通信的其他语音设备进行多端仲裁;以及基于多端仲裁的结果,选择一个语音设备与用户进行当前语音交互。
[0009]根据本专利技术的第五方面,提出了一种智能语音面板,能够与至少一个其他语音设备通信,其中,所述智能语音面板包括:麦克风,用于获取用户输入的语音;扬声器,用于向
用户输出语音反馈;以及通信单元,用于与所述至少一个其他语音设备通信;仲裁单元,用于基于预定的仲裁规则,从所述智能语音面板和至少一个其他语音设备中动态选择与所述用户进行当前语音交互的一个语音设备。
[0010]根据本专利技术的第六方面,提出了一种智能音箱,能够与至少一个其他语音设备通信,其中,所述智能音箱包括:麦克风,用于获取用户输入的语音;扬声器,用于向用户输出语音反馈;以及通信单元,用于与所述至少一个其他语音设备通信;仲裁单元,用于基于预定的仲裁规则,从所述智能音箱和至少一个其他语音设备中动态选择与所述用户进行当前语音交互的一个语音设备。
[0011]根据本专利技术的第七方面,提出了一种智能语音会议系统,可以包括如上所述的各种能够相互通信的多个语音设备。所述语音设备具有远场语音交互功能并且用于进行语音交互,并且包括至少两个智能语音面板;其中,所述多个语音设备基于预定的仲裁规则,选择其中的一个语音设备与用户进行当前语音交互,所述当前语音交互用于如下至少一项:进行会议通话;以及进行智能语音交互。
[0012]由此,本专利技术通过上述语音交互系统、方法、设备和会议系统,能够通过基于用户实时状态的多端仲裁实现多个语音设备的动态选择。具体地,可以通过就近应答等原则确定最适于与用户交互的设备,由此提升为用户提供语音服务的准确性和易用性。
附图说明
[0013]通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
[0014]图1示出了需要选择语音设备进行交互的一个场景。
[0015]图2示出了在家中安装多个语音设备的一个例子。
[0016]图3示出了根据本专利技术一个实施例的语音交互系统的组成示意图。
[0017]图4示出了根据本专利技术的多端仲裁机制的一个例子。
[0018]图5示出了根据本专利技术一个实施例的分布式语音交互系统的例子。
[0019]图6示出了根据本专利技术的一种语音设备的组成示意图。
[0020]图7示出了根据本专利技术一个实施例的语音交互方法的流程示意图。
具体实施方式
[0021]下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
[0022]越来越多的用户配备了智能语音交互终端(例如,智能音箱)作为家中的智能交互中心。智能音箱是音箱和网络技术升级的产物,可以用作家庭消费者用语音上网的工具。智能音箱可以进行点播歌曲、上网购物,或是了解天气预报的操作,也可以对智能家居设备进行控制,比如打开窗帘、设置冰箱温度、提前让热水器升温等。
[0023]虽然语音交互终端通常采用远场拾音技术使得其能够接收3-5m范围之外的语音
输入,但上述远场拾音通常无法覆盖较大交互空间内的所有位置,尤其是考虑到房间门、墙壁和上下楼等阻隔,以及会议室场景等的情况时。为了提升语音交互的可达性,可以考虑在家中布置多个语音交互终端。而在存在多个语音交互终端时,如何恰当选择终端与用户交互成为了本领域需要解决的一个问题。
[0024]图1示出了需要选择语音设备进行交互的一个场景。具体地,图1示出了用户使用家中与同一个号码a绑定的四台语音设备110并使用语音设备呼叫号码b的情景。
[0025]由于一个语音交互终端的覆盖范围有限,因此在较大的空间中,可以安装多个语音设备以实现全面覆盖。图2示出了在家中安装多个语音设备的一个例子。如图所示,为了方便随时随地进行语音呼叫,用户在客厅、厨房、主卧和次卧中分别安装了语音交互设备210。
[0026]上述语音交互设备210可以是常见的智能音箱,也可以是其他具备语音交互功能的设备。在本专利技术中,语音交互设备210尤其可以实现为智能语音面板,该面板可以安装开关或空调控制面板一样在墙上,并且彼此具有相同的功能和权限,以方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音交互系统,包括多个相互通信的语音设备,其中,所述语音设备具有远场语音交互功能并且用于进行语音交互;其中,所述多个语音设备基于预定仲裁规则,选择其中的一个语音设备与用户进行当前语音交互。2.如权利要求1所述的系统,其中,所述预定的仲裁规则包括多端仲裁规则,并且所述多个语音设备基于预定的仲裁规则,选择其中的一个语音设备与用户进行当前语音交互包括:所述多个语音设备中的被激活的语音设备交换当前信息;以及所述被激活的语音设备基于交换的当前信息,选择符合所述预定仲裁规则的一个语音设备与用户进行当前语音交互。3.如权利要求2所述的系统,其中,所述被激活的语音设备基于所述当前信息,选择符合所述预定仲裁规则的一个语音设备与用户进行当前语音交互包括:基于交换的当前信息,从所述被激活的语音设备中选择一个语音设备作为主节点;所述主节点基于预定仲裁规则,选择所述多个语音设备中的一个语音设备与用户进行当前语音交互。4.如权利要求2所述的系统,其中,基于交换的当前信息,选择与用户进行当前语音交互的语音设备和/或主节点包括如下至少一项:基于就近唤醒规则进行选择;基于上电顺序进行选择;基于趋势预判规则进行选择。5.如权利要求4所述的系统,所述就近唤醒规则包括:获取被激活的至少两个语音设备采集的用户语音强度信息;以及基于所述至少两个语音设备的用户语音强度信息,确定主节点和/或与用户进行当前语音交互的语音设备。6.如权利要求5所述的系统,其中,所述多个语音设备基于预定的仲裁规则,选择其中的一个语音设备与用户进行当前语音交互还包括:所述多个语音设备获取状态感知设备采集的当前用户状态,并且所述预定的仲裁规则还包括:基于所述当前用户状态,确定主节点和/或与用户进行当前语音交互的语音设备。7.如权利要求6所述的系统,其中,采集当前用户状态的操作包括如下至少一项:拍摄所述用户的图像;对所述用户进行红外追踪扫描;以及获取所述用户操作设备的设备状态。8.如权利要求1所述的系统,其中,所述多个语音设备基于预定的仲裁规则,选择其中的一个语音设备与用户进行当前语音交互包括:基于如下至少一项,动态切换与所述用户进行当前语音交互的语音设备:所述多个语音设备中至少两个语音设备采集的用户语音强度信息的变化;以及基于状态感知设备采集到的当前用户状态的变化。9.如权利要求1所述的系统,其中,基于被选择进行当前语音交互的语音设备属性,明
确所述当前语音交互中的模糊意图。10.如权利要求1所述的系统,其中,所述多个相互通信的语音设备包括:基于近距离通信规范进行组网通信的多个语音设备。11.如权利要求10所述的系统,还包括如下至少一项:用于采集当前用户状态的状态感知设备;以及基于被选择的语音设备与用户进行的当前语音交互,进行相应操作的受控设备。12.如权利要求10所述的系统,还包括:中控设备,用于:接收基于所述当前语音交互生成的操作指令;以及基于所述操作指令,控制受控设备进行所述相应操作。13.如权利要求1所述的系统,还包括如下至少一项:服务端,用于获取当前语音交互的交互内容,并下发反馈信息;以及边缘计算设备,用于获取当前语音交互的交互内容,并下发反馈信息。14.如权利要求1所述的系统,其中,所述多个语音设备包括一个中心节点,并且所述多个语音设备基于预定的仲裁规则,选择其中的一个语音设备与用户进行当前语音交互包括:所述中心节点汇总其他语音设备发送的信息并进行仲裁;以及所述中心节点基于仲裁结果动态切换所述多个语音设备中的一个语音设备与用户进行当前语音交互。15.一种语音会议系统,包括多个相互通信的语音设备,其中,所述语音设备具有远场语音交互功能并且用于进行语音交互;其中,所述多个语音设备基于预定的仲裁规则,选择其中的一个语音设备与用户进行当前语音交互,所述当前语音交互用于如下至少一项:进行会议通话;以及进行智能语音交互。16.如权利要求15所述的系统,其中,所述预定的仲裁规则包括多端仲裁规则,并且所述多个语音设备基于预定的仲裁规则,选择其中的一个语音设备与用户进行当前语音交互:基于就近唤醒规则,从所述多个语音设备中动态选择一个语音设备作为主节点;所述主节点汇总其他语音设备发送的信息并进行仲裁;以及所述主节点基于仲裁结果选择所述多个语音设备中的一个语音设备与用户进行当前语音交互。17.如权利要求15所述的系统,其中,所述多个语音设备基于预定的仲裁规则,选择其中的一个语音设备与用户进行当前语音交互包括:基于如下至少一项,动态切换与所述用户进行当前语音交互的语音设备:所述多个语音设备中至少两个语音设备采集的用户语音强度信息的变化;以及位置感知设备采集到的当前用户状态的变...

【专利技术属性】
技术研发人员:杨智慧王路付强马骁田彪纳跃跃史鹏腾
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1