画面对焦方法、装置、终端及对应的存储介质制造方法及图纸

技术编号:20751309 阅读:20 留言:0更新日期:2019-04-03 11:29
本发明专利技术提供一种画面对焦方法,其包括:获取视频画面,并根据指示命令确定所述视频画面中的目标物体;根据目标物体所在的视频画面区域在多帧视频画面帧中的锐度变化信息,确定目标物体所在的视频画面区域的画面深度信息;获取多帧视频画面帧对应的拍摄相机的参数信息;将视频画面区域的画面深度信息以及拍摄相机的参数信息作为预设的对焦神经网络模型的输入,以使得预设的对焦神经网络模型输出视频画面对应拍摄相机的对焦调整信息;使用拍摄相机的对焦调整信息对拍摄相机进行调焦操作。本发明专利技术基于目标物体的画面深度信息以及拍摄相机的参数信息,使用对焦神经网络模型对目标物体进行对焦调整操作,可有效提高对焦操作的精度以及对焦操作的准确度。

【技术实现步骤摘要】
画面对焦方法、装置、终端及对应的存储介质
本专利技术涉及图像处理
,特别是涉及一种画面对焦方法、装置、终端及对应的存储介质。
技术介绍
现有的画面自动操作一般是对画面每个区域的画面锐度进行检测,随后基于画面每个区域的画面锐度计算每个画面区域的深度信息,最后根据每个画面区域的深度信息进行画面对焦操作。但是在画面对焦过程中,画面区域的画面锐度一直在变化,在不同画面拍摄环境下,锐度差的计算可能会存在偏差,从而影响画面对焦操作的操作精度,因此导致现有的画面对焦方法的对焦操作精度以及准确度较差。故,有必要提供一种画面对焦方法及装置,以解决现有技术所存在的问题。
技术实现思路
本专利技术实施例提供一种对焦操作的精度较高且对焦操作的准确度加高的画面对焦方法及装置;以解决现有的画面对焦方法及装置中对焦操作精度以及准确度较差的技术问题。本专利技术实施例提供一种画面对焦方法,其包括:获取视频画面,并根据指示命令确定所述视频画面中的目标物体;根据所述目标物体所在的视频画面区域在多帧视频画面帧中的锐度变化信息,确定所述目标物体所在的视频画面区域的画面深度信息;获取所述多帧视频画面帧对应的拍摄相机的参数信息;将所述视频画面区域的画面深度信息以及所述拍摄相机的参数信息作为预设的对焦神经网络模型的输入,以使得所述预设的对焦神经网络模型输出所述视频画面对应拍摄相机的对焦调整信息;以及使用所述拍摄相机的对焦调整信息对所述拍摄相机进行调焦操作。在本专利技术所述的画面对焦方法中,所述画面对焦方法还包括:获取多个具有不同画面深度信息的训练视频画面以及对应的拍摄相机的训练参数信息;基于人工对焦调整结果,获取每个训练视频画面对应的训练对焦调整信息;以及将所述训练视频画面的画面深度信息以及拍摄相机的训练参数信息作为预设对焦神经网络模型框架的输入,将所述视频画面对应的训练对焦调整信息作为预设对焦神经模型框架的输出,通过机器训练得到所述对焦神经网络模型框架的模型参数,以获取所述对焦神经网络模型。在本专利技术所述的画面对焦方法中,所述根据所述目标物体所在的视频画面区域在多帧视频画面帧中的锐度变化信息,确定所述目标物体所在的视频画面区域的画面深度信息的步骤包括:获取目标物体所在的视频画面区域在多帧视频画面帧中的画面锐度;以及根据相邻的视频画面帧的画面锐度的差值以及所述拍摄相机的调焦距离,确定所述目标物体所在的视频画面区域的画面深度信息。在本专利技术所述的画面对焦方法中,所述根据所述目标物体所在的视频画面区域在多帧视频画面帧中的锐度变化信息,确定所述目标物体所在的视频画面区域的画面深度信息的步骤包括:获取多帧视频画面帧中的最高画面锐度值;以及根据相邻的视频画面帧的最高画面锐度值的差值以及所述拍摄相机的调焦距离,确定所述目标物体所在的视频画面区域的画面深度信息。在本专利技术所述的画面对焦方法中,所述获取所述多帧视频画面帧对应的拍摄相机的参数信息的步骤包括:获取所述多帧视频画面帧对应的拍摄相机的镜头信息、对焦信息、相机位置信息以及相机姿态信息。本专利技术还提供一种画面对焦装置,其包括:视频画面获取模块,用于获取视频画面,并根据指示命令确定所述视频画面中的目标物体;画面深度信息确定模块,用于根据所述目标物体所在的视频画面区域在多帧视频画面帧中的锐度变化信息,确定所述目标物体所在的视频画面区域的画面深度信息;参数信息获取模块,用于获取所述多帧视频画面帧对应的拍摄相机的参数信息;对焦调整信息输出模块,用于将所述视频画面区域的画面深度信息以及所述拍摄相机的参数信息作为预设的对焦神经网络模型的输入,以使得所述预设的对焦神经网络模型输出所述视频画面对应拍摄相机的对焦调整信息;以及调焦模块,用于使用所述拍摄相机的对焦调整信息对所述拍摄相机进行调焦操作。在本专利技术所述的画面对焦装置中,所述画面对焦装置还包括:训练输入信息获取模块,用于获取多个具有不同画面深度信息的训练视频画面以及对应的拍摄相机的训练参数信息;训练输出信息获取模块,用于基于人工对焦调整结果,获取每个训练视频画面对应的训练对焦调整信息;以及训练模块,用于将所述训练视频画面的画面深度信息以及拍摄相机的训练参数信息作为预设对焦神经网络模型框架的输入,将所述视频画面对应的训练对焦调整信息作为预设对焦神经模型框架的输出,通过机器训练得到所述对焦神经网络模型框架的模型参数,以获取所述对焦神经网络模型。在本专利技术所述的画面对焦装置中,所述参数信息获取模块用于,获取所述多帧视频画面帧对应的拍摄相机的镜头信息、对焦信息、相机位置信息以及相机姿态信息。本专利技术还提供一种计算机可读存储介质,其内存储有处理器可执行指令,所述指令由一个或一个以上处理器加载,以执行上述任一的画面对焦方法。本专利技术还提供一种终端,其包括处理器和存储器,所述存储器存储有多条指令,所述处理器从所述存储器中加载指令,以执行上述任一项所述的画面对焦方法。相较于现有技术的画面对焦方法及装置,本专利技术的画面对焦方法及装置基于目标物体的画面深度信息以及拍摄相机的参数信息,使用对焦神经网络模型对目标物体进行对焦调整操作,可有效的提高对焦操作的精度以及对焦操作的准确度,有效的解决了现有的画面对焦方法及装置中对焦操作精度以及准确度较差的技术问题。附图说明图1为本专利技术的画面对焦方法的第一实施例的流程图;图2为本专利技术的画面对焦方法的第一实施例的步骤S102的流程图;图3为本专利技术的画面对焦方法对应的对焦神经网络模型的模型训练流程;图4为本专利技术的画面对焦方法的第二实施例的流程图;图5为本专利技术的画面对焦方法的第二实施例的步骤S402的流程图;图6为本专利技术的画面对焦装置的第一实施例的结构示意图;图7为本专利技术的画面对焦装置对应的对焦神经网络模型的模型训练相关模块的结构示意图;图8为本专利技术的画面对焦装置所在的电子设备的工作环境结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的画面对焦方法及装置可用于对拍摄画面进行自动对焦操作的电子设备。该电子设备包括但不限于可穿戴设备、头戴设备、医疗健康平台、个人计算机、服务器计算机、手持式或膝上型设备、移动设备(比如移动电话、个人数字助理(PDA)、媒体播放器等等)、多处理器系统、消费型电子设备、小型计算机、大型计算机、包括上述任意系统或设备的分布式计算环境,等等。该电子设备优选为可进行拍照或视频拍摄的电子拍摄终端,以便对拍摄画面或视频进行自动对焦操作,由于本专利技术的电子设备基于目标物体的画面深度信息以及拍摄相机的参数信息,使用对焦神经网络模型对拍摄画面中的目标物体进行对焦调整操作,因此可有效的提高对焦操作的精度以及对焦操作的准确度。请参照图1,图1为本专利技术的画面对焦方法的第一实施例的流程图。本实施例的画面对焦方法可使用上述的电子设备进行实施,该画面对焦方法包括:步骤S101,获取视频画面,并根据指示命令确定视频画面中的目标物体;步骤S102,根据目标物体所在的视频画面区域在多帧视频画面帧中的锐度变化信息,确定目标物体所在的视频画面区域的画面深度信息本文档来自技高网...

【技术保护点】
1.一种画面对焦方法,其特征在于,包括:获取视频画面,并根据指示命令确定所述视频画面中的目标物体;根据所述目标物体所在的视频画面区域在多帧视频画面帧中的锐度变化信息,确定所述目标物体所在的视频画面区域的画面深度信息;获取所述多帧视频画面帧对应的拍摄相机的参数信息;将所述视频画面区域的画面深度信息以及所述拍摄相机的参数信息作为预设的对焦神经网络模型的输入,以使得所述预设的对焦神经网络模型输出所述视频画面对应拍摄相机的对焦调整信息;以及使用所述拍摄相机的对焦调整信息对所述拍摄相机进行调焦操作。

【技术特征摘要】
1.一种画面对焦方法,其特征在于,包括:获取视频画面,并根据指示命令确定所述视频画面中的目标物体;根据所述目标物体所在的视频画面区域在多帧视频画面帧中的锐度变化信息,确定所述目标物体所在的视频画面区域的画面深度信息;获取所述多帧视频画面帧对应的拍摄相机的参数信息;将所述视频画面区域的画面深度信息以及所述拍摄相机的参数信息作为预设的对焦神经网络模型的输入,以使得所述预设的对焦神经网络模型输出所述视频画面对应拍摄相机的对焦调整信息;以及使用所述拍摄相机的对焦调整信息对所述拍摄相机进行调焦操作。2.根据权利要求1所述的画面对焦方法,其特征在于,所述画面对焦方法还包括:获取多个具有不同画面深度信息的训练视频画面以及对应的拍摄相机的训练参数信息;基于人工对焦调整结果,获取每个训练视频画面对应的训练对焦调整信息;以及将所述训练视频画面的画面深度信息以及拍摄相机的训练参数信息作为预设对焦神经网络模型框架的输入,将所述视频画面对应的训练对焦调整信息作为预设对焦神经模型框架的输出,通过机器训练得到所述对焦神经网络模型框架的模型参数,以获取所述对焦神经网络模型。3.根据权利要求1所述的画面对焦方法,其特征在于,所述根据所述目标物体所在的视频画面区域在多帧视频画面帧中的锐度变化信息,确定所述目标物体所在的视频画面区域的画面深度信息的步骤包括:获取目标物体所在的视频画面区域在多帧视频画面帧中的画面锐度;以及根据相邻的视频画面帧的画面锐度的差值以及所述拍摄相机的调焦距离,确定所述目标物体所在的视频画面区域的画面深度信息。4.根据权利要求3所述的画面对焦方法,其特征在于,所述根据所述目标物体所在的视频画面区域在多帧视频画面帧中的锐度变化信息,确定所述目标物体所在的视频画面区域的画面深度信息的步骤包括:获取多帧视频画面帧中的最高画面锐度值;以及根据相邻的视频画面帧的最高画面锐度值的差值以及所述拍摄相机的调焦距离,确定所述目标物体所在的视频画面区域的画面深度信息。5.根据权利要求1所述的画面对焦方法,其特征在于,所述获取所述多...

【专利技术属性】
技术研发人员:马睿李攀鹏
申请(专利权)人:深圳看到科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1