语音控制系统、方法、装置、设备以及介质、程序产品制造方法及图纸

技术编号:34378801 阅读:45 留言:0更新日期:2022-08-03 20:51
本申请提供了一种语音控制系统,该系统应用于人工智能领域,包括:运行于移动终端上的第一客户端、运行于服务器上的服务端和运行于被控终端上的第二客户端。第一客户端获取用户的身份信息,向服务端发送用户的身份信息,服务端对用户的身份信息进行验证。第一客户端还采集用户的语音数据,根据该语音数据生成语音控制请求向服务端发送该语音控制请求。当身份信息验证通过时,服务端根据语音控制请求生成控制指令,并发送给第二客户端。第二客户端指示被控终端执行该控制指令。如此使得被控终端能够支持语音控制,而且不需要改造,降低了成本,提高了可用性。而且,基于身份信息进行验证,保障了语音控制的安全性。保障了语音控制的安全性。保障了语音控制的安全性。

Voice control system, method, device, equipment, medium and program product

【技术实现步骤摘要】
语音控制系统、方法、装置、设备以及介质、程序产品


[0001]本申请涉及人工智能(artificial intelligence,AI)
,尤其涉及一种语音控制系统以及对应的方法、装置、设备、计算机可读存储介质、计算机程序产品。

技术介绍

[0002]随着语音技术尤其是语音识别技术的不断发展,通过语音对设备进行语音控制逐渐成为一种可能。相对于传统的鼠标控制、键盘控制、按钮控制、遥控器控制等控制方式,语音控制无需用户手动键入相关内容,并通过鼠标触发相应控件,也不需要用户事先了解各种按钮或遥控器的功能,用户根据自身意图发出相应的语音,即可对设备进行控制。语音控制的使用门槛较低,控制方式更加灵活、便捷,因而具有广泛的应用前景。
[0003]目前,许多设备原生不支持语音控制,例如许多智能电视、会议终端不支持语音控制,导致控制过程比较繁琐,用户体验较差。如何使得原生不支持语音控制的设备支持语音控制,成为业界重点关注的问题。

技术实现思路

[0004]本申请提供了一种语音控制系统,一方面,该系统采用移动终端自带的麦克风阵列采集用户的语音数据,利用移动终端或者服务器对语音数据进行语音识别,由此可以使得原生不支持语音控制的被控终端能够支持语音控制,而且不需要改造被控终端,成本较低且具有较高可用性,另一方面,该系统中服务端对用户的身份信息进行验证,验证通过时,再对被控终端进行控制,进一步提高了安全性。本申请还提供了上述系统对应的方法、装置、设备、计算机可读存储介质以及计算机程序产品。
[0005]第一方面,本申请提供一种语音控制系统,用于对被控终端进行控制。该系统包括第一客户端、服务端和第二客户端,第一客户端运行于移动终端上,服务端运行于服务器上,第二客户端运行与被控终端上。
[0006]其中,移动终端是指可移动的、便携终端。在一些实现方式中,移动终端可以具有显示屏。移动终端包括但不限于智能手机、平板电脑、个人数字助理或者智能穿戴设备。智能穿戴设备包括智能手环、智能手表、智能眼镜等等。服务器可以是云环境中的云服务器,例如中心服务器和边缘服务器。服务器也可以是本地数据中心的服务器,本地数据中心是指处于用户所属的数据中心。被控终端可以是具有显示屏的终端,例如智能电视或会议终端。
[0007]具体地,第一客户端用于获取用户的身份信息,并将该身份信息发送给服务端。第一客户端还用于采集用户的语音数据,根据该语音数据生成语音控制请求,并将该语音控制请求发送给服务端。服务端用于对第一客户端发送的身份信息进行验证,当对该身份信息验证通过时,对第一客户端发送的语音控制请求进行处理,例如根据语音控制请求生成控制指令,然后发送该控制指令给第二客户端。第二客户端用于指示被控终端执行该控制指令,进而实现对被控终端进行语音控制。可见,即使在被控终端没有内置语音芯片和麦克
风阵列的情况下,该语音控制系统也能够实现对被控终端进行语音控制。
[0008]一方面,采用移动终端自带的麦克风阵列采集用户的语音数据,基于该语音数据可以生成语音控制请求,然后服务端根据语音控制请求对被控终端进行控制。即使被控终端没有语音芯片和麦克风阵列,用户也能够通过移动终端和服务器对被控终端进行语音控制。如此可以使得原生不支持语音控制的被控终端也能够支持语音控制,而且不需要对被控终端进行改造,降低了成本,提高了可用性。另外,通过移动终端采集用户的语音数据可以使得用户随意改变位置,而不限定用户所处的位置范围。
[0009]另一方面,服务端还基于移动终端上运行的第一客户端发送的身份信息,对用户进行身份验证,验证通过时,服务端再根据语音控制请求控制被控终端,如此可以避免非法用户对被控终端进行语音控制,提高了安全性。
[0010]在一些可能的实现方式中,语音控制请求携带有被控终端的标识。该标识通常具有唯一性,用于区别网络中的其他被控终端。基于此,标识可以是媒体访问控制地址、网络地址或者通用唯一识别码,其中,网络地址具体可以为互联网协议地址。服务端可以通过该标识识别被控终端。
[0011]第一客户端可以通过多种方式获取被控终端的标识。具体地,移动终端支持近距离无线通信(也称作近场通信)时,移动终端可以靠近被控终端的近场通信模块,如被控终端内置的近场通信模块或者是独立于该被控终端的近场通信模块,从而建立近场通信连接,如此,第一客户端可以通过上述近场通信连接,获得被控终端的标识。
[0012]移动终端具备图形扫描能力时,第一客户端还可以调用移动终端的摄像头,扫描识别码,从而获得被控终端的标识。其中,识别码可以是二维码、条形码等。被控终端的显示屏中可以预先显示二维码,用户可以手持移动终端,利用移动终端扫描二维码,移动终端上运行的第一客户端可以解析二维码,获得被控终端的标识。
[0013]第一客户端也可以直接接收用户输入的被控终端的标识。例如,第一客户端向用户呈现交互界面,用户可以通过该交互界面输入被控终端的标识,进而第一客户端能够接收到用户输入的标识。
[0014]移动终端支持蓝牙功能时,移动终端还可以通过蓝牙连接被控终端,如此移动终端上运行的第一客户端可以通过蓝牙获得被控终端的标识。移动终端支持无线局域网或无线热点连接时,移动终端上运行的第一客户端还可以通过无线局域网或者无线热点,获得被控终端的标识。以无线局域网为例,移动终端和被控终端接入同一无线局域网时,移动终端和被控终端通过该无线局域网的接入点建立连接,移动终端可以通过该连接获取被控终端的标识,如此第一客户端能够获得被控终端的标识。
[0015]在该方法中,移动终端可以通过各种便捷的方式获得被控终端的标识,进而实现对该标识对应的被控终端进行语音控制。控制方式对用户比较友好,提升了用户体验。而且移动终端支持上述多种方式中的任意一种即可对被控终端进行语音控制,具有较高可用性和兼容性。
[0016]在一些可能的实现方式中,服务端对用户的身份信息进行验证通过后,服务端还可以根据用户的身份信息向第一客户端返回用户的权限信息。考虑到安全性,针对不同的用户,服务端根据其身份信息设置不同的权限。举例说明,公司内部员工与外部供应商的权限可以是不同的。在一些示例中,公司内部员工具有调整亮度和音量、切换屏幕显示内容、
文件投屏、打开公司一般文件的权限,外部供应商具有调整亮度和音量、切换屏幕显示内容、文件投屏的权限,但是不具有打开公司一般文件的权限。
[0017]具体地,服务端可以预先配置不同用户的控制权限,如此服务端可以根据用户的身份信息确定用户的权限信息,然后向第一客户端返回该权限信息。第一客户端可以根据用户的权限信息,确定与该权限信息匹配的功能,然后将该功能呈现给用户,用户能够基于第一客户端呈现的功能选择相应功能对被控终端进行控制。
[0018]如此,该语音控制系统可以实现根据不同用户的权限进行个性化的语音控制,满足多样性的业务需求。
[0019]在一些可能的实现方式中,服务端还可以动态调整用户的控制权限。以会议场景为例,服务端可以根据会本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音控制系统,其特征在于,所述语音控制系统包括第一客户端、服务端与第二客户端,所述第一客户端运行于移动终端上,所述服务端运行于服务器上,所述第二客户端运行于被控终端上;所述第一客户端,用于获取用户的身份信息,并向所述服务端发送所述用户的身份信息;采集所述用户的语音数据,并根据所述语音数据生成语音控制请求,向所述服务端发送所述语音控制请求;所述服务端,用于对所述用户的身份信息进行验证;当所述用户的身份信息验证通过时,根据所述语音控制请求生成控制指令,向所述第二客户端发送所述控制指令;所述第二客户端,用于指示所述被控终端执行所述控制指令。2.根据权利要求1所述的系统,其特征在于,所述语音控制请求包括所述被控终端的标识;所述第一客户端,用于:通过近距离无线通信NFC,获得所述被控终端的标识;或者,通过扫描识别码,获得所述被控终端的标识;或者,接收所述用户输入的、所述被控终端的标识;或者,通过蓝牙连接所述被控终端,获得所述被控终端的标识;或者,通过无线局域网或无线热点连接所述被控终端,获得所述被控终端的标识。3.根据权利要求1或2所述的系统,其特征在于,所述服务端,用于根据所述用户的身份信息向所述第一客户端返回所述用户的权限信息;所述第一客户端,用于通过所述移动终端的屏幕呈现与所述用户的权限信息匹配的功能。4.根据权利要求1至3任一项所述的系统,其特征在于,所述服务端,用于向所述第二客户端发送所述用户的身份信息;所述第二客户端,还用于通过所述被控终端的屏幕呈现所述用户的身份信息。5.根据权利要求1至4任一项所述的系统,其特征在于,所述服务端,用于根据所述语音控制请求,识别所述用户的意图;根据所述用户的意图,获得所述控制指令。6.根据权利要求5所述的系统,其特征在于,所述服务端,用于从与所述被控终端对应的指令集中查找与所述用户的意图匹配的控制指令;当查找成功时,获取所述控制指令,当查找失败时,向所述第一客户端发送提示信息,所述提示信息用于指示所述被控终端不支持所述用户的语音数据所对应的功能;所述第一客户端,用于通过所述移动终端的屏幕呈现所述提示信息。7.一种语音控制方法,其特征在于,应用于语音控制系统,所述语音控制系统包括第一客户端、服务端与第二客户端,所述第一客户端运行于移动终端上,所述服务端运行于服务器上,所述第二客户端运行于被控终端上,所述方法包括:所述第一客户端获取用户的身份信息,向所述服...

【专利技术属性】
技术研发人员:李涵伍治源王俊王雷
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1