一种多模态摄像控制方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：32646290 阅读：12 留言：0更新日期：2022-03-12 18:29

本发明专利技术公开了一种多模态摄像控制方法、装置、计算机设备及存储介质。该方法包括：捕捉用户的参数调节语音指令，并基于所述参数调节语音指令，判断是否进入参数调节模式；若不进入参数调节模式，则直接捕捉用户的眼睛注视点，并基于当前眼睛注视点，确定摄像焦点区域并拍摄；若进入参数调节模式，则继续接收用户的语音执行指令，并基于所述语音执行指令对参数进行相应的调节；在参数调节完成后，利用表情识别模型识别用户面部表情，在用户面部表情符合预设的面部表情阈值后，确定摄像焦点区域并拍摄。该方法通过捕捉用户的参数调节语音指令，自动对摄像终端进行参数调整，使用户在不方便用手调整的状态下，也能够实现对人脸的拍摄。也能够实现对人脸的拍摄。也能够实现对人脸的拍摄。

全部详细技术资料下载

【技术实现步骤摘要】
一种多模态摄像控制方法、装置、计算机设备及存储介质

[0001]本专利技术涉及人脸识别领域，尤其涉及一种多模态摄像控制方法、装置、计算机设备及存储介质。

技术介绍

[0002]人在摄像的过程中需要同时用到手和眼睛，即根据眼睛观察到的图像，评估图像和自己所想要的目标画面的差距，然后用手操控摄像机，调整相关参数以获得自己想要的画面效果。当人手被占用，执行其他操作时，就无法用手操作摄像机，如按下开关按钮，拨动调节焦距的挡杆等，也就无法拍摄画面。

技术实现思路

[0003]本专利技术的目的是提供一种多模态摄像控制方法、装置、计算机设备及存储介质，旨在解决在人手被占用的场景下，无法对摄像终端进行操作的问题。
[0004]为解决上述技术问题，本专利技术的目的是通过以下技术方案实现的：提供一种多模态摄像控制方法，其包括：
[0005]捕捉用户的参数调节语音指令，并基于所述参数调节语音指令，判断是否进入参数调节模式；
[0006]若不进入参数调节模式，则直接捕捉用户的眼睛注视点，并基于当前眼睛注视点，确定摄像焦点区域并拍摄；
[0007]若进入参数调节模式，则继续接收用户的语音执行指令，并基于所述语音执行指令对参数进行相应的调节；
[0008]在参数调节完成后，利用表情识别模型识别用户面部表情，在用户面部表情符合预设的面部表情阈值后，确定摄像焦点区域并拍摄。
[0009]另外，本专利技术要解决的技术问题是还在于提供一种多模态摄像控制装置，其包括：
[0010]捕...

【技术保护点】

【技术特征摘要】
1.一种多模态摄像控制方法，其特征在于，包括：捕捉用户的参数调节语音指令，并基于所述参数调节语音指令，判断是否进入参数调节模式；若不进入参数调节模式，则直接捕捉用户的眼睛注视点，并基于当前眼睛注视点，确定摄像焦点区域并拍摄；若进入参数调节模式，则继续接收用户的语音执行指令，并基于所述语音执行指令对参数进行相应的调节；在参数调节完成后，利用表情识别模型识别用户面部表情，在用户面部表情符合预设的面部表情阈值后，确定摄像焦点区域并拍摄。2.根据权利要求1所述的多模态摄像控制方法，其特征在于，所述继续接收用户的语音执行指令，并基于所述语音执行指令对参数进行相应的调节之前，包括：停止捕捉用户的眼睛注视点，并在显示器上显示当前的参数，其中，所述参数包括摄像机的焦距数值、光圈数值以及感光度数值。3.根据权利要求2所述的多模态摄像控制方法，其特征在于，所述继续接收用户的语音执行指令，并基于所述语音执行指令对参数进行相应的调节，包括：接收当前的语音执行指令，并将语音执行指令发送至云端，使所述云端判断当前的语音执行命令是否出现关键词，若当前的语音执行命令出现关键词，则基于关键词返回对应的调整指令；基于所述调整指令对相应的参数进行调整，并显示在所述显示器上。4.根据权利要求1所述的多模态摄像控制方法，其特征在于，所述在参数调节完成后，利用表情识别模型识别用户面部表情，在用户面部表情符合预设的面部表情阈值后，确定摄像焦点区域并拍摄，包括：基于预设的面部扫描识别频率对人脸进行捕捉，得到当前的人脸图像；利用表情识别模型对当前的所述人脸图像进行识别，根据正面表情、负面表情以及中立表情的识别结果进行权重投票，若权重投票结果大于预设的面部表情阈值，则确定摄像焦点区域并拍摄，若权重投票结果小于预设的面部表情阈值，则返回接续接收新的语音执行指令。5.根据权利要求4所述的多模态摄像控制方法，其特征在于，所述根据正面表情和负面表情的识别结果进行权重投票，包括：将所述正面表情的占比设置为50％～60％。6.根据权利要求4所述的多模态摄像控制...

【专利技术属性】
技术研发人员：王军锋，
申请(专利权)人：深圳万兴软件有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人