一种控制方法、装置、设备及存储介质制造方法及图纸

技术编号：30434720 阅读：34 留言：0更新日期：2021-10-24 17:33

本发明专利技术公开了一种控制方法、装置、设备及存储介质。该方法包括：若麦克风处于未被占用状态，则通过所述麦克风采集语音信息，并通过车内摄像头采集图像信息；根据所述语音信息和所述图像信息确定说话人的位置信息；若根据所述说话人的位置信息从所述图像信息中截取说话人对应的第一图像信息；若根据所述第一图像信息确定说话人没有打电话，且根据所述图像信息和所述语音信息确定说话人未和车内除说话人外的其他人交谈，则将所述语音信息和所述图像信息发送至服务器，以使所述服务器根据所述语音信息和所述图像信息确定目标指令和回复语音信息；接收服务器发送的目标指令和回复语音信息，执行所述目标指令，并播放所述回复语音信息。音信息。音信息。

全部详细技术资料下载

【技术实现步骤摘要】
一种控制方法、装置、设备及存储介质

[0001]本专利技术实施例涉及车辆
，尤其涉及一种控制方法、装置、设备及存储介质。

技术介绍

[0002]现在车载语音已经越来越普及，用户可使用车载语音助手，来实现导航、播放语音以及车辆控制等功能。但语音助手在使用前，必须将其唤醒激活，才能发起语音交互。常见的唤醒方式为唤醒词，或者唤醒按钮。
[0003]现有市场问题：
[0004]1.一种方法是通过点击中控屏幕上的唤醒按钮，实现车载语音助手的唤醒。这种方式的弊端更多，对于驾驶员来说，需要视线和手同时脱离路面和方向盘，带来非常大的安全隐患；对于后排乘客，方控语音按键只有主驾驶可以使用，车上其它用户无法操作中控屏幕上的唤醒按钮，局限性较大，体验较差。
[0005]2.唤醒词的交互方式较为生硬，不够自然，并且对老用户来说有记忆成本，新用户有学习成本。
[0006]3.大部分车载语音助手，通过唤醒词语音唤醒后，需要等待唤醒应答音，用户确认唤醒成功后，方才可以下达具体的语音指令；如果唤醒后，未在指定时间内收到...

【技术保护点】

【技术特征摘要】
1.一种控制方法，其特征在于，包括：若麦克风处于未被占用状态，则通过所述麦克风采集语音信息，并通过车内摄像头采集图像信息；根据所述语音信息和所述图像信息确定说话人的位置信息；根据所述说话人的位置信息从所述图像信息中截取说话人对应的第一图像信息；若根据所述第一图像信息确定说话人没有打电话，且根据所述图像信息和所述语音信息确定说话人未和车内除说话人外的其他人交谈，则将所述语音信息和所述图像信息发送至服务器，以使所述服务器根据所述语音信息和所述图像信息确定目标指令和回复语音信息；接收服务器发送的目标指令和回复语音信息，执行所述目标指令，并播放所述回复语音信息。2.根据权利要求1所述的方法，其特征在于，在根据所述第一图像信息确定说话人没有打电话之前，还包括：获取麦克风的工作状态和扬声器的工作状态；若所述麦克风处于未被占用状态，和/或，所述扬声器处于未被占用状态，则根据所述第一图像信息判断说话人是否在打电话。3.根据权利要求1所述的方法，其特征在于，所述说话人的数量大于或者等于两个，相应的，根据所述图像信息和所述语音信息确定说话人未和车内除说话人外的其他人交谈包括：若根据所述第一图像信息和所述语音信息确定至少两个说话人之间未交谈，则根据所述图像信息获取车内除说话人外的其他人的目标时间范围内的语音信息，其中，所述目标时间范围的开始时间为说话人说话前预设时间，所述目标时间范围的终止时间为说话人说话结束后预设时间；根据所述其他人的目标时间范围内的语音信息和说话人对应的语音信息确定说话人未和车内除说话人外的其他人交谈。4.根据权利要求3所述的方法，其特征在于，根据所述第一图像信息和所述语音信息确定至少两个说话人之间未交谈，包括：根据所述第一图像信息和所述语音信息确定至少两个说话人分别对应的语音信息和语音信息对应的时间信息；根据所述至少两个说话人分别对应的语音信息和语音信息对应的时间信息确定至少两个说话人之间未交谈。5.根据权利要求1所述的方法，其特征在于，所述车内摄像头设置在天窗的控制面板上，和/或，所述车内摄像头设置在后视镜上方预设位置。6.一种控制装置，其...

【专利技术属性】
技术研发人员：袁志伟，
申请(专利权)人：中国第一汽车股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人