语音控制系统和方法、语音套件、骨传导及语音处理装置制造方法及图纸

技术编号:29060491 阅读:23 留言:0更新日期:2021-06-30 09:02
公开了一种语音控制系统和方法、以及相应地语音套件、骨传导及语音处理装置。所述语音控制系统,包括语音套件以及与语音套件通信的服务端,语音套件包括:骨传导装置,基于骨传导采集用户的语音输入并将采集到的语音输入发送给语音处理装置;语音处理装置,用于接收所述骨传导装置采集到的语音输入,并将所述语音输入上传至服务端,所述服务端,用于对所述语音处理装置发送的所述语音输入进行语义识别,以生成并下发识别语义所对应的目标设备操作的操作命令。本发明专利技术通过骨传导传感器有效解决麦克风通过空气传播接收信号易受干扰的问题,确保设备只能被使用者唤醒,同时增强语音指令识别准确度,提高设备使用者的智能语音操作体验。验。验。

【技术实现步骤摘要】
语音控制系统和方法、语音套件、骨传导及语音处理装置


[0001]本专利技术涉及信息
,尤其涉及一种语音控制系统和方法、以及相应地语音套件、骨传导及语音处理装置。

技术介绍

[0002]随着智能技术的普及与发展,用语音实现对各类设备的控制业已成为标配。例如,在现有技术中,语音控制可以通过作为家中控制节点的智能音箱或是自身带有语音交互功能的电器本身来实现。
[0003]现有的智能语音设备通常使用麦克风接收语音指令。然而利用麦克风接收语音指令无法屏蔽非设备使用者的语音指令,并且在环境噪声较大时难以准确识别语音指令。
[0004]为此,需要一种稳妥准确的语音控制方案。

技术实现思路

[0005]为了解决上述至少一个问题,本专利技术提出了一种利用骨传导装置作为语音采集入口,将其发送至语音处理装置,后者在经由本地或云端实现语义解析和对应命令下发,由此方便对各类设备进行准确控制的方案。
[0006]根据本专利技术的第一方面,提出了一种语音控制系统,包括语音套件以及与所述语音套件通信的服务端,其中,所述语音套件包括:骨传导装置,基于骨传导采集用户的语音输入并将采集到的语音输入发送给语音处理装置;语音处理装置,用于接收所述骨传导装置采集到的语音输入,并将所述语音输入上传至服务端,所述服务端,用于对所述语音处理装置发送的所述语音输入进行语义识别,以生成并下发识别语义所对应的目标设备操作的操作命令。
[0007]根据本专利技术的第二方面,提出了一种语音套件,包括:骨传导装置,基于骨传导采集语音输入并将采集到的语音输入发送给语音处理装置;语音处理装置,包括与所述骨传导装置通信连接的通信单元,所述语音处理装置经由所述通信单元接收所述骨传导装置采集到的语音数据,以实现针对所述语音输入的语义识别以及识别语义所对应的目标设备操作。
[0008]根据本专利技术的第三方面,提出了一种骨传导装置,包括:骨传导传感器,用于经由骨传导采集用户的语音输入;骨传导扬声器,用于将从语音处理装置和/或目标设备接收到的内容经由骨传导送入用户耳道;通信模组,用于将采集到的语音输入发送给所述语音处理装置,以通过所述语音处理装置实现针对所述语音输入的语义识别以及识别语义所对应的目标设备操作。
[0009]根据本专利技术的第四方面,提出了一种语音处理装置,包括:通信单元,用于接收所述骨传导装置采集到的语音数据;以及联网单元,用于将从所述骨传导装置接收到的来自用户的语音数据上传至服务端,其中,所述服务端和/或所述语音处理装置进行针对所述语音输入的语义识别,以生成并下发识别语义所对应的目标设备操作的操作命令。
[0010]根据本专利技术的第五方面,提出了一种语音控制方法,包括:骨传导装置采集语音输入;所述骨传导装置将所述语音输入发送给语音处理装置;所述语音处理装置实现针对所述语音输入的语义识别以及对应目标设备操作命令的生成。
[0011]本专利技术利用声波骨传导原理,通过骨传导传感器有效解决麦克风通过空气传播接收信号易受干扰的问题,确保设备只能被使用者唤醒,同时增强语音指令识别准确度,从而提高设备使用者智能语音操作体验。
附图说明
[0012]通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
[0013]图1示出了根据本专利技术一个实施例的骨传导装置的组成示意图。
[0014]图2示出了佩戴骨传导装置的一个例子。
[0015]图3示出了本专利技术一个骨传导装置的组成例。
[0016]图4示出了根据本专利技术一个实施例的语音套件的组成示意图。
[0017]图5示出了本专利技术语音套件采集语音输入的例子。
[0018]图6示出了根据本专利技术一个实施例的语音控制系统的组成示意图。
[0019]图7示出了根据本专利技术一个实施例的语音控制方法的示意性流程图。
[0020]图8示出了本专利技术一个语音控制的处理流程例。
[0021]图9示出了本专利技术的智能语音可穿戴设备的工作示意图。
具体实施方式
[0022]下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
[0023]如上所述,现有的智能语音设备利用麦克风接收语音指令,通常无法屏蔽非设备使用者的语音指令,并且在环境噪声较大时难以准确识别语音指令。为此,提出了一种利用骨传导装置作为语音采集入口,并经由本地通信将其发送至语音处理装置,后者在经由本地或云端实现语义解析和对应命令下发,由此方便对各类设备进行准确控制的方案。
[0024]骨传导是一种声音传导方式,即通过将声音转化为不同频率的机械振动,通过人的颅骨、骨迷路、内耳淋巴液传递、螺旋器、听神经、听觉中枢来传递声波。相对于通过振膜产生声波的经典声音传导方式,骨传导省去了许多声波传递的步骤,能在嘈杂的环境中实现清晰的声音还原,而且声波也不会因为在空气中扩散而影响到他人。
[0025]骨传导技术分为骨传导扬声器技术和骨传导麦克风技术。骨传导扬声器技术用于听取声音。气导扬声器是把电信号转化为的声波(振动信号)传至听神经。而骨传导扬声器则是电信号转化的声波(振动信号)直接通过骨头传至听神经。骨传导麦克风技术用于收集声音。气导送话是声波通过空气传至麦克风,骨传导送话则直接通过骨头传递。骨传导麦克风是一种非声传感器,下文中也可称为骨传导传感器。人说话时声带振动会传递到喉头和
头骨,为骨传导传感器通过采集这种振动信号并转换为电信号来获得语音。背景噪声很难对这类非声传感器产生影响,所以骨导语音从声源处就屏蔽了噪声,因此尤其适用于强噪声环境下的语音通信。
[0026]图1示出了根据本专利技术一个实施例的骨传导装置的组成示意图。如图1所示,骨传导装置100可以包括骨传导传感器110和通信模组120。骨传导传感器110用于经由骨传导采集用户的语音输入。通信模组120则用于将采集到的语音输入发送给语音处理装置,以基于该语音处理装置实现针对所述语音输入的语义识别以及识别语义所对应的目标设备操作。如下所述,目标设备可以是语音处理装置本身,也可以是语音处理装置之外的其他智能设备或是传统家电设备。
[0027]骨传导装置可以结合语音处理装置构成一种语音套件(如下图4所示)。在此,“套件”指代协助作用以实现特定功能的一组装置。在本专利技术中,骨传导装置由于需要直接从喉头和头骨采集振动信号,因此需要用户直接佩戴。在一个实施例中,骨传导装置可以实现为一个独立的骨传导耳机。图2示出了佩戴骨传导装置的一个例子。如图所示,用户喉部声带振动发声。声音沿着实线标示经空气向外传播,同时沿着虚线标示经骨头体内传播。此时,骨传导装置就可以利用骨传导传感器110对振动信号进行采集,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音控制系统,包括语音套件以及与所述语音套件通信的服务端,其中,所述语音套件包括:骨传导装置,基于骨传导采集用户的语音输入并将采集到的语音输入发送给语音处理装置;语音处理装置,用于接收所述骨传导装置采集到的语音输入,并将所述语音输入上传至服务端,所述服务端,用于对所述语音处理装置发送的所述语音输入进行语义识别,以生成并下发识别语义所对应的目标设备操作的操作命令。2.如权利要求1所述的系统,其中,所述骨传导装置包括唤醒模组,在所述唤醒模组从所述语音输入识别出唤醒词之后将采集到的语音输入发送给所述语音处理装置;和/或所述语音处理装置包括唤醒模组,在所述唤醒模从所述语音输入识别出唤醒词之后将接收到的语音输入上传至所述服务端。3.如权利要求1所述的系统,其中,所述语音处理装置包括语音采集装置,用于采集第二语音输入;所述语音处理装置将所述第二语音输入上传至服务端,所述服务端,用于对所述语音处理装置发送的所述第二语音输入进行语义识别,以生成并下发识别语义所对应的目标设备操作的第二操作命令。4.如权利要求3所述的系统,其中,所述服务端用于:基于所述语音输入和所述第二语音输入的比对,生成并下发所述操作命令和/或第二操作命令。5.如权利要求4所述的系统,其中,基于所述语音输入和所述第二语音输入的比对,生成并下发所述操作命令和/或第二操作命令包括:基于所述语音输入和所述第二语音输入的比对,生成当前环境信息,并基于所述当前环境信息生成所述操作命令和/或第二操作命令;基于所述语音输入和所述第二语音输入的比对,判断多人交互场景,并基于所述多人交互场景生成所述操作命令和/或第二操作命令;以及基于所述语音输入和所述第二语音输入的比对,对所述第二语音输入进行滤除无关信息的处理,并基于经处理所述第二语音输入生成所述第二操作命令。6.如权利要求3所述的系统,其中,所述语音处理装置用于:基于从所述语音输入识别出的唤醒词,开启语音控制操作。7.如权利要求3所述的系统,其中,所述骨传导装置用于:基于场景信息,开启或关闭语音输入采集功能,和/或所述语音处理装置用于:基于场景信息,开启或关闭第二语音输入采集功能。8.如权利要求7所述的系统,其中,所述场景信息包括如下至少一项:基于所述骨传导装置上传感器采集的信号所确定的场景信息;基于所述语音处理装置传感器采集的信号所确定的场景信息;基于所述语音处理装置上关联功能所确定的场景信息;以及
基于所述语音输入和所述第二语音输入的比对所确定的场景信息。9.如权利要求1所述的系统,其中,所述骨传导装置的语音输入采集功能基于如下至少一项开启:所述骨传导装置被佩戴的操作;以及针对所述骨传导装置的特定动作。10.如权利要求1所述的系统,其中,所述语音处理装置用于针对至少部分所述语音输入进行语义识别,并生成识别语义所对应的目标设备操作的操作命令。11.如权利要求1所述的系统,其中,所述骨传导装置包括:骨传导传感器,用于经由骨传导获取用户的语音输入;骨传导扬声器,用于将从所述语音处理装置和/或目标设备接收到的内容经由骨传导送入用户耳道。12.如权利要求11所述的系统,其中,进行输出的内容包括如下至少一项:对执行命令的陈述内容;执行命令的结果内容;以及与用户的交互内容。13.如权利要求1所述的系统,其中,所述目标设备直接从所述服务端接收下发的操作命令并执行与所述操作命令相对应的操作;和/或所述语音处理装置接收所述服务端下发的操作命令,自行或经由所述骨传导装置向所述目标设备下发所述操作命令。14.如权利要求1所述的系统,其中,所述目标设备包括如下至少一项:所述语音处理装置本身;从所述服务端接收下发的操作命令并执行的联网的智能家电设备;以及经由所述语音处理装置获取操作命令的传统家电设备。15.如权利要求1所述的系统,其中,所述服务端包括:与所述语音套件近距离通信的本地服务端,所述本地服务端用于针对至少部分所述语音输入进行语义识别,生成识别语义所对应的目标设备操作的操作命令并下发所述操作命令。16.一种语音套件,包括:骨传导装置,基于骨传导采集语音输入并将采集到的语音输入发送给语音处理装置;语音处理装置,包括与所述骨传导装置通信连接的通信单元,所述语音处理装置经由所述通信单元接收所述骨传导装置采集到的语音数据,以实现针对所述语音输入的语义识别以及识别语义所对应的目标设备操作。17.如权利要求16所述的套件,其中,所述语音处理装置包括语...

【专利技术属性】
技术研发人员:李滨海
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1