语音指令的生成方法、装置、可读存储介质及电子设备制造方法及图纸

技术编号：39273436 阅读：9 留言：0更新日期：2023-11-07 10:51

本公开实施例公开了一种语音指令的生成方法、装置、计算机可读存储介质及电子设备，其中，该方法包括：获取用户感应信息，并基于用户感应信息，确定位于目标区域的用户的第一用户信息；基于第一用户信息和用户信息库，确定目标区域中用户的目标用户信息；响应于接收到语音控制信号，确定语音控制信号的语音属性；确定语音属性与目标用户信息的匹配关系；响应于匹配关系为匹配，生成语音控制信号对应的语音指令。本公开实施例可以对语音控制信号的来源进行自动匹配，保证了目标用户的语音控制权限不被其他用户占用，降低了语音控制信号误识别的风险。同时实现了对目标区域中用户的目标用户信息进行自动记录，提高了用户使用的便利性。性。性。

全部详细技术资料下载

【技术实现步骤摘要】
语音指令的生成方法、装置、可读存储介质及电子设备

[0001]本公开涉及计算机
，尤其是一种语音指令的生成方法、装置、计算机可读存储介质及电子设备。

技术介绍

[0002]随着人工智能技术的发展，利用语音对设备进行控制的场景越来越丰富。但随之而来的误识别等问题越来越多。
[0003]例如，可以用语音对车辆进行控制，用来执行调整车窗高度、控制车内多媒体播放、控制导航程序等。为了车辆行驶的安全性，个别应用功能需要限制用户的控制权限，例如语音控制导航等仅限于驾驶位上的人员使用，因此需要对语音指令的来源进行准确定位，以避免非驾驶位上的人员与驾驶位上的人员的语音控制权限发生冲突，影响驾驶安全。
[0004]目前通常使用音区定位方法来对语音的来源进行定位，音区定位需要使用多个麦克风采集多路语音信号。但多路麦克风无法解决非主驾位的人员靠近主驾位导致错误地将非主驾位人员误识别为主驾位人员的问题。

技术实现思路

[0005]为了解决上述技术问题，本公开的实施例提供了一种语音指令的生成方法、装置、计算机可读存储介质及电子设备，以减少语音控制的误识别的风险，同时自动记录目标区域的用户信息，无需用户主动注册，提高用户使用的便利性。
[0006]本公开的实施例提供了一种语音指令的生成方法，该方法包括：获取用户感应信息，并基于用户感应信息，确定位于目标区域的用户的第一用户信息；基于第一用户信息和用户信息库，确定目标区域中用户的目标用户信息；响应于接收到包括控制指令的语音控制信号，确定语音控制信号的语...

【技术保护点】

【技术特征摘要】
1.一种语音指令的生成方法，包括：获取用户感应信息，并基于所述用户感应信息，确定位于目标区域的用户的第一用户信息；基于所述第一用户信息和用户信息库，确定所述目标区域中用户的目标用户信息；响应于接收到包括控制指令的语音控制信号，确定所述语音控制信号的语音属性；确定所述语音属性与所述目标用户信息的匹配关系；响应于所述匹配关系为匹配，生成所述语音控制信号对应的语音指令。2.根据权利要求1所述的方法，其中，所述基于所述用户感应信息，确定位于目标区域的用户的第一用户信息，包括：基于所述用户感应信息包括的图像序列，确定位于所述目标区域的用户的第一脸部图像序列和所述用户的脸部特征信息；和/或，基于所述用户感应信息包括的语音信号，确定位于所述目标区域的用户的第一声纹信息；基于所述用户的脸部特征信息和/或所述用户的第一声纹信息，确定所述第一用户信息。3.根据权利要求2所述的方法，其中，所述基于所述用户感应信息包括的语音信号，确定位于所述目标区域的用户的第一声纹信息，包括：基于所述用户感应信息包括的语音信号，确定所述语音信号的第一声源位置和初始声纹信息；确定所述第一声源位置与所述目标区域的位置的匹配关系；响应于所述第一声源位置与所述目标区域的位置的匹配关系为匹配，获取所述用户的第一脸部图像序列，并对所述第一脸部图像序列进行唇动检测，得到所述用户的第一唇动检测结果；确定所述第一唇动检测结果与所述语音信号的匹配关系；响应于所述第一唇动检测结果与所述语音信号匹配，将所述初始声纹信息确定为所述目标区域的用户的第一声纹信息。4.根据权利要求2所述的方法，其中，所述基于所述第一用户信息和用户信息库，确定所述目标区域中用户的目标用户信息，包括：将所述第一用户信息包括的所述用户的脸部特征信息和/或所述用户的第一声纹信息，与所述用户信息库中的用户信息进行匹配；响应于所述用户信息库中存在与所述用户的脸部特征信息和/或所述用户的第一声纹信息匹配的匹配用户信息，基于所述匹配用户信息和/或所述第一用户信息，确定所述用户的目标用户信息。5.根据权利要求4所述的方法，其中，所述基于所述匹配用户信息和/或所述第一用户信息，确定所述用户的目标用户信息，包括：响应于所述匹配用户信息中包括所述用户的脸部特征信息且不包括所述用户的第一声纹信息，基于所述匹配用户信息确定所述用户的目标用户信息，并基于所述用户的第一声纹信息，更新所述匹配用户信息中的声纹信息；响应于所述匹配用户信息中包括所述用户的声纹信息且不包括所述用户的脸部特征
信息，基于所述匹配用户信息确定所...

【专利技术属性】
技术研发人员：陶然，
申请(专利权)人：南京地平线集成电路有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人