一种语音控制方法、可穿戴设备及终端技术

技术编号:22821876 阅读:44 留言:0更新日期:2019-12-14 14:53
本申请实施例公开了一种语音控制方法、可穿戴设备及终端,涉及终端领域,可在用户使用语音控制终端时提高声纹识别的准确性和安全性。该方法包括:终端与可穿戴设备建立通信连接;当发声用户向可穿戴设备输入语音信息时,终端根据所述语音信息中第一语音分量的第一声纹识别结果和所述语音信息中第二语音分量的第二声纹识别结果,对所述发声用户进行身份鉴权;所述第一语音分量是由所述可穿戴设备的第一语音传感器采集到的,所述第二语音分量是由所述可穿戴设备的第二语音传感器采集到的;若所述终端对所述发声用户的身份鉴权结果为所述发声用户为合法用户,则所述终端执行与所述语音信息对应的操作指令。

A voice control method, wearable device and terminal

【技术实现步骤摘要】
【国外来华专利技术】一种语音控制方法、可穿戴设备及终端
本申请涉及终端领域,尤其涉及一种语音控制方法、可穿戴设备及终端。
技术介绍
声纹(voiceprint)是指用户发声时携带言语信息的声波频谱,能够反映出用户的音频特征。由于不同人在讲话时使用的发声器官(例如,舌、牙齿、喉头、肺、鼻腔等)在尺寸和形态方面具有差异,所以任意两个人的声波频谱一般具有差异性。因此,通过声纹识别(speakerrecognition,SR)可以对一种或多种语音信息进行分析,从而达到对未知声音进行辨别的目的。目前,传统的声纹识别方式主要利用常规麦克风采集经过空气传播的说话人声音信号,进而根据采集到的说话人声音信号识别说话人身份。但是,如果说话人身处嘈杂的环境,采集到的说话人声音信号噪音较大,容易干扰声纹识别的准确性。并且,如果有人恶意使用说话人的录音模拟说话人声音信号,手机等终端会因无法准确辨识而增加安全风险。
技术实现思路
本申请提供一种语音控制方法、可穿戴设备及终端,可在用户使用语音控制终端时提高声纹识别的准确性和安全性。为达到上述目的,本申请采用如下技术方案:第一方面,本申请提供一种语音控制方法,包括:终端与可穿戴设备建立通信连接;当发声用户向可穿戴设备输入语音信息时,终端根据该语音信息中第一语音分量的第一声纹识别结果和该语音信息中第二语音分量的第二声纹识别结果,对发声用户进行身份鉴权;其中,第一语音分量是由可穿戴设备的第一语音传感器采集到的,第二语音分量是由可穿戴设备的第二语音传感器采集到的;若终端对发声用户的身份鉴权结果为该发声用户是合法用户,则终端执行与该语音信息对应的操作指令。可以看出,可穿戴设备在采集发声用户的语音信息时使用两个语音传感器采集到了两路语音信息(即上述第一语音分量和第二语音分量)。这样,终端可针对这两路语音信息分别进行声纹识别,当这两路语音信息的声纹识别结果均与合法用户匹配时,可确认此时的发声用户为合法用户。显然,这种两路语音信息的双重声纹识别过程相比于一路语音信息的声纹识别过程能够显著提高用户身份鉴权时的准确性和安全性。另外,如果第二语音分量是由可穿戴设备的骨传导麦克风采集到的,则说明用户在发声时已经佩戴该可穿戴设备,从而避免非法用户使用合法用户的录音恶意控制合法用户的终端的情况。在一种可能的设计方法中,在终端根据该语音信息中第一语音分量的第一声纹识别结果和该语音信息中第二语音分量的第二声纹识别结果,对该发声用户进行身份鉴权之前,还包括:终端从可穿戴设备获取第一声纹识别结果和第二声纹识别结果,第一声纹识别结果为可穿戴设备对第一语音分量进行声纹识别后得到的,第二声纹识别结果为可穿戴设备对第二语音分量进行声纹识别后得到的。也就是说,可穿戴设备采集到发声用户语音信息中的第一语音分量和第二语音分量后,可在本地对这两路语音分量分别进行声纹识别,进而将识别结果发送给终端,从而可降低终端在实现语音控制时的实现复杂度。在一种可能的设计方法中,在终端根据该语音信息中第一语音分量的第一声纹识别结果和该语音信息中第二语音分量的第二声纹识别结果,对该发声用户进行身份鉴权之前,还包括:终端从可穿戴设备获取第一语音分量和第二语音分量;终端对第一语音分量和第二语音分量分别进行声纹识别,得到与第一语音分量对应的第一声纹识别结果以及与第二语音分量对应的第二声纹识别结果。也就是说,可穿戴设备采集到发声用户语音信息中的第一语音分量和第二语音分量后,可将这两路语音分量发送给终端进行声纹识别,从而降低可穿戴设备的功耗和实现复杂度。在一种可能的设计方法中,终端对第一语音分量和第二语音分量分别进行声纹识别,包括:当该语音信息中包括预设的关键词时,终端对第一语音分量和第二语音分量进行声纹识别;或者;当接收到用户输入的预设操作时,终端对第一语音分量和第二语音分量进行声纹识别。否则,说明用户此时没有进行声纹识别的需求,则终端无需开启声纹识别功能,从而降低终端的功耗。在一种可能的设计方法中,终端对第一语音分量和第二语音分量分别进行声纹识别,包括:终端判断第一语音分量与合法用户的第一声纹模型是否匹配,第一声纹模型用于反映第一语音传感器采集到的该合法用户的音频特征;终端判断第二语音分量与合法用户的第二声纹模型是否匹配,第二声纹模型用于反映第二语音传感器采集到的该合法用户的音频特征;此时,终端根据该语音信息中第一语音分量的第一声纹识别结果和该语音信息中第二语音分量的第二声纹识别结果,对该发声用户进行身份鉴权,包括:若第一语音分量与合法用户的第一声纹模型匹配,且第二语音分量与合法用户的第二声纹模型匹配,则终端确定该发声用户为合法用户;否则,终端确定该发声用户为非法用户。在一种可能的设计方法中,终端判断第一语音分量与合法用户的第一声纹模型是否匹配,包括:终端计算第一语音分量与该合法用户的第一声纹模型之间的第一匹配度;若第一匹配度大于第一阈值,则终端确定第一语音分量与该合法用户的第一声纹模型匹配;终端判断第二语音分量与合法用户的第二声纹模型是否匹配,包括:终端计算第二语音分量与该合法用户的第二声纹模型之间的第二匹配度;若第二匹配度大于第二阈值,则终端确定第二语音分量与该合法用户的第二声纹模型匹配。在一种可能的设计方法中,在终端根据该语音信息中第一语音分量的第一声纹识别结果和该语音信息中第二语音分量的第二声纹识别结果,对该发声用户进行身份鉴权之前,还包括:终端获取可穿戴设备发送的启动指令,该启动指令是可穿戴设备响应于用户输入的唤醒语音生成的;响应于该启动指令,终端打开声纹识别功能。在一种可能的设计方法中,在终端从可穿戴设备获取第一语音分量和第二语音分量之后,还包括:终端根据第一语音分量和第二语音分量确定该语音信息中是否包含预设的唤醒词;若包含预设的唤醒词,则终端打开声纹识别功能。也就是说,用户可以通过说出唤醒词触发终端开启声纹识别功能,否则,说明用户此时没有进行声纹识别的需求,则终端无需开启声纹识别功能,从而降低终端的功耗。在一种可能的设计方法中,若该发声用户为合法用户,则该方法还包括:终端自动执行解锁操作。这样,用户只需要输入一次语音信息即可完成用户身份鉴权、手机解锁以及打开手机某一功能等一些列操作,从而大大提高了用户对手机的操控效率和用户体验。在一种可能的设计方法中,在终端执行与该语音信息对应的操作指令之前,还包括:终端获取可穿戴设备的设备标识;其中,终端执行与该语音信息对应的操作指令,包括:若可穿戴设备的设备标识为预设的合法设备标识,则终端执行与该语音信息对应的操作指令。这样,终端可以接收和执行合法蓝牙设备发来的相关操作指令,而当非法蓝牙设备向终端发送操作指令时,终端可丢弃该操作指令以提高安全性。第二方面,本申请提供一种语音控制方法,包括:可穿戴设备与终端建立通信连接;可穿戴设备使用第一语音传感器采集语音信息中的第一语音分量;可穿戴设备使用第二语音传感器采集该语音信息中的第二语音分量;可穿戴设备对第一语音分量和第二语音分量分别进行声纹识别,以便对发声用户进行身份鉴权。本文档来自技高网...

【技术保护点】
1.一种语音控制方法,其特征在于,包括:/n当发声用户向可穿戴设备输入语音信息时,终端根据所述语音信息中第一语音分量的第一声纹识别结果和所述语音信息中第二语音分量的第二声纹识别结果,对所述发声用户进行身份鉴权;所述可穿戴设备与所述终端通信连接,所述第一语音分量是由所述可穿戴设备的第一语音传感器采集到的,所述第二语音分量是由所述可穿戴设备的第二语音传感器采集到的;/n若所述终端对所述发声用户的身份鉴权结果为所述发声用户为合法用户,则所述终端执行与所述语音信息对应的操作指令。/n

【技术特征摘要】
【国外来华专利技术】1.一种语音控制方法,其特征在于,包括:
当发声用户向可穿戴设备输入语音信息时,终端根据所述语音信息中第一语音分量的第一声纹识别结果和所述语音信息中第二语音分量的第二声纹识别结果,对所述发声用户进行身份鉴权;所述可穿戴设备与所述终端通信连接,所述第一语音分量是由所述可穿戴设备的第一语音传感器采集到的,所述第二语音分量是由所述可穿戴设备的第二语音传感器采集到的;
若所述终端对所述发声用户的身份鉴权结果为所述发声用户为合法用户,则所述终端执行与所述语音信息对应的操作指令。


2.根据权利要求1所述的语音控制方法,其特征在于,在终端根据所述语音信息中第一语音分量的第一声纹识别结果和所述语音信息中第二语音分量的第二声纹识别结果,对所述发声用户进行身份鉴权之前,还包括:
所述终端从所述可穿戴设备获取第一声纹识别结果和第二声纹识别结果,所述第一声纹识别结果为所述可穿戴设备对所述第一语音分量进行声纹识别后得到的,所述第二声纹识别结果为所述可穿戴设备对所述第二语音分量进行声纹识别后得到的。


3.根据权利要求1所述的语音控制方法,其特征在于,在终端根据所述语音信息中第一语音分量的第一声纹识别结果和所述语音信息中第二语音分量的第二声纹识别结果,对所述发声用户进行身份鉴权之前,还包括:
所述终端从所述可穿戴设备获取所述第一语音分量和所述第二语音分量;
所述终端对所述第一语音分量和所述第二语音分量分别进行声纹识别,得到与所述第一语音分量对应的第一声纹识别结果以及与所述第二语音分量对应的第二声纹识别结果。


4.根据权利要求3所述的语音控制方法,其特征在于,所述终端对所述第一语音分量和所述第二语音分量分别进行声纹识别,包括:
当所述语音信息中包括预设的关键词时,所述终端对所述第一语音分量和所述第二语音分量进行声纹识别;或者;
当接收到用户输入的预设操作时,所述终端对所述第一语音分量和所述第二语音分量进行声纹识别。


5.根据权利要求3或4所述的语音控制方法,其特征在于,所述终端对所述第一语音分量和所述第二语音分量分别进行声纹识别,包括:
所述终端判断所述第一语音分量与合法用户的第一声纹模型是否匹配,所述第一声纹模型用于反映所述第一语音传感器采集到的所述合法用户的音频特征;
所述终端判断所述第二语音分量与合法用户的第二声纹模型是否匹配,所述第二声纹模型用于反映所述第二语音传感器采集到的所述合法用户的音频特征;
其中,终端根据所述语音信息中第一语音分量的第一声纹识别结果和所述语音信息中第二语音分量的第二声纹识别结果,对所述发声用户进行身份鉴权,包括:
若所述第一语音分量与合法用户的第一声纹模型匹配,且所述第二语音分量与合法用户的第二声纹模型匹配,则所述终端确定所述发声用户为合法用户;否则,所述终端确定所述发声用户为非法用户。


6.根据权利要求5所述的语音控制方法,其特征在于,所述终端判断所述第一语音分量与合法用户的第一声纹模型是否匹配,包括:
所述终端计算所述第一语音分量与所述合法用户的第一声纹模型之间的第一匹配度;
若所述第一匹配度大于第一阈值,则所述终端确定所述第一语音分量与所述合法用户的第一声纹模型匹配;
其中,所述终端判断所述第二语音分量与合法用户的第二声纹模型是否匹配,包括:
所述终端计算所述第二语音分量与所述合法用户的第二声纹模型之间的第二匹配度;
若所述第二匹配度大于第二阈值,则所述终端确定所述第二语音分量与所述合法用户的第二声纹模型匹配。


7.根据权利要求1-6中任一项所述的语音控制方法,其特征在于,在所述终端根据所述语音信息中第一语音分量的第一声纹识别结果和所述语音信息中第二语音分量的第二声纹识别结果,对所述发声用户进行身份鉴权之前,还包括:
所述终端获取所述可穿戴设备发送的启动指令,所述启动指令是所述可穿戴设备响应于用户输入的唤醒语音生成的;
响应于所述启动指令,所述终端打开声纹识别功能。


8.根据权利要求3-6中任一项所述的语音控制方法,其特征在于,在所述终端从所述可穿戴设备获取所述第一语音分量和所述第二语音分量之后,还包括:
所述终端根据所述第一语音分量和所述第二语音分量确定所述语音信息中是否包含预设的唤醒词;
若包含预设的唤醒词,则所述终端打开声纹识别功能。


9.根据权利要求1-8中任一项所述的语音控制方法,其特征在于,若所述发声用户为合法用户,则所述方法还包括:
所述终端自动执行解锁操作。


10.根据权利要求1-9中任一项所述的语音控制方法,其特征在于,在所述终端执行与所述语音信息对应的操作指令之前,还包括:
所述终端获取所述可穿戴设备的设备标识;
其中,所述终端执行与所述语音信息对应的操作指令,包括:
若所述可穿戴设备的设备标识为预设的合法设备标识,则所述终端执行与所述语音信息对应的操作指令。


11.一种终端,其特征在于,包括:
触摸屏,其中,所述触摸屏包括触敏表面和显示器;
一个或多个处理器;
一个或多个存储器;
以及一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述一个或多个存储器中,所述一个或多...

【专利技术属性】
技术研发人员:张龙黎椿键仇存收常青
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1