目标图片抓拍方法、系统、介质及装置制造方法及图纸

技术编号:28222196 阅读:13 留言:0更新日期:2021-04-28 09:48
本发明专利技术属于图像处理领域,具体涉及一种目标图片抓拍方法、系统、介质及装置。本发明专利技术旨在解决人工抓拍对摄像用户的摄像技术的要求较高,且很容易由于拍照技术较差的原因导致抓拍的照片不够清晰、耗费时间长等问题。为此,本发明专利技术通过先将视频流中的人像图片中任一目标人体的人像特征与预设人像特征进行匹配;进一步,当匹配成功的人像特征对应的目标人体在预设时间内的位置变化量在设定的位置变化量阈值范围内时,将包含该目标人体的人像图片确认为抓拍的目标图片。从而,当使用摄像机通过该方法进行抓拍时,无需拍摄者具有较高的摄像技术,即可完成满足人脸表情特征、人体姿态特征和清晰度要求的图片的拍摄工作。和清晰度要求的图片的拍摄工作。和清晰度要求的图片的拍摄工作。

【技术实现步骤摘要】
目标图片抓拍方法、系统、介质及装置


[0001]本专利技术属于图像处理领域,具体涉及一种目标图片抓拍方法、系统、介质及装置。

技术介绍

[0002]在人们的生活和工作中,通常需要对一些精彩瞬间进行抓拍,例如,对公园里面正在跑步的人、模特走秀时摆出的Pose以及舞蹈演员跳出的优雅舞姿进行抓拍。
[0003]目前,人们在用摄像机进行抓拍时都是通过人工操作,人们需要一直盯着显示器,以在某个精彩瞬间出现时进行抓拍。不仅需要耗费人大量的精力,而且也容易漏掉精彩的镜头。此外,人工抓拍对摄像用户的摄像技术的要求也很高,对于普通的摄像用户,很容易由于拍照技术不高的原因导致抓拍的照片不够清晰、耗费时间长等问题。
[0004]相应地,本领域需要一种改进的目标图片抓拍方法、系统、介质及装置来解决上述问题。

技术实现思路

[0005]为了克服上述缺陷,提出了本专利技术,以提供解决或至少部分解决:人工抓拍对摄像用户的摄像技术的要求较高,且很容易由于拍照技术较差的原因导致抓拍的照片不够清晰、耗费时间长等问题。为解决上述技术问题,本专利技术提供了一种目标图片抓拍方法、系统、介质及装置。
[0006]第一方面,本专利技术提供了一种目标图片抓拍方法,所述方法包括:获取视频流中的人像图片;将所述人像图片中任一目标人体的人像特征与预设人像特征进行匹配;根据所述视频流计算与匹配成功的人像特征对应的目标人体在预设时间内的位置变化量;当所述位置变化量在设定的位置变化量阈值范围内时,将包含所述目标人体的人像图片确认为抓拍的目标图片。
[0007]作为本专利技术提供的上述方法的一种优选的技术方案,人像特征包括人脸表情特征和/或人体姿态特征,将所述人像图片中任一目标人体的人像特征与预设人像特征进行匹配的步骤,包括:将所述人像图片中的人脸表情特征与预设人脸表情特征进行匹配;以及/或者,将所述人像图片中的人体姿态特征与预设人体姿态特征进行匹配。
[0008]作为本专利技术提供的上述方法的一种优选的技术方案,将所述人像图片中的人像特征与预设人像特征进行匹配的步骤,包括:通过预先训练好的卷积神经网络模型将所述人像图片中的人像特征与预设人像特征进行匹配;所述卷积神经网络模型的输入为人像图片,输出为匹配成功的人像特征。
[0009]作为本专利技术提供的上述方法的一种优选的技术方案,所述卷积神经网络模型包括输入层、卷积层、池化层和全连接层;所述卷积神经网络模型的训练过程为:所述输入层接收经过预处理后得到的所有人像图片样本;其中,所述人像图片样本为包含人脸表情特征和/或人体姿态特征的图片样本;所述卷积层提取所述人像图片样本中的人像特征;所述池化层提取所述人像特征中的感兴趣区域;所述全连接层通过激活函数对所述感兴趣区域中
的人脸表情特征和/或人体姿态特征进行分类并输出。
[0010]作为本专利技术提供的上述方法的一种优选的技术方案,所述卷积神经网络模型的训练过程还包括:所述池化层采用注意力模型引入注意力模块SGE,为每个所述人像特征添加注意力因子,以确定所述人像特征的感兴趣区域;所述全连接层采用小波变换函数对所述感兴趣区域进行滤波处理,然后再采用激活函数在所述感兴趣区域中提取人脸表情特征和/或人体姿态特征。
[0011]作为本专利技术提供的上述方法的一种优选的技术方案,所述激活函数包括Sigmod、Tanh、RELU、leaky ReLU和maxout中的任一种。
[0012]作为本专利技术提供的上述方法的一种优选的技术方案,在将所述人像图片中的人像特征与预设人像特征进行匹配时,使用的算法包括CNN、Gabor小波变换和SAE中的至少一种。
[0013]作为本专利技术提供的上述方法的一种优选的技术方案,根据所述视频流计算与匹配成功的人像特征对应的目标人体在预设时间内的位置变化量的步骤,包括:获取匹配成功的人像特征中预设数量的连续的多个时间切片,计算多个时间切片之间各人像关键点的位置变化量,作为相应的人像特征的位置变化量。
[0014]作为本专利技术提供的上述方法的一种优选的技术方案,将包含匹配成功的人像特征的人像图片确认为抓拍的目标图片的步骤,包括:在连续的多个时间切片中选择一个作为所述目标图片。
[0015]作为本专利技术提供的上述方法的一种优选的技术方案,在将所述人像图片中的人像特征与预设人像特征进行匹配的步骤之前,所述方法还包括:对所述人像图片进行预处理;所述预处理包括人像检测、图片增强以及通过人像关键点进行对齐校准。
[0016]第二方面,本专利技术还提供了一种目标图片抓拍系统,所述系统包括:获取模块,用于获取视频流中的人像图片;匹配模块,用于将所述人像图片中任一目标人体的人像特征与预设人像特征进行匹配;计算模块,用于根据所述视频流计算与匹配成功的人像特征对应的目标人体在预设时间内的位置变化量;确认模块,用于当所述位置变化量在设定的位置变化量阈值范围内时,将包含所述目标人体的人像图片确认为抓拍的目标图片。
[0017]获取模块,用于获取视频流中的人像图片;匹配模块,用于将所述人像图片中的人像特征与预设人像特征进行匹配;计算模块,用于计算匹配成功的人像特征在预设时间内的位置变化量;确认模块,用于当匹配成功的人像特征在预设时间内的位置变化量在设定的位置变化量阈值范围内时,将包含匹配成功的人像特征的人像图片确认为抓拍的目标图片。
[0018]作为本专利技术提供的上述系统的一种优选的技术方案,所述匹配模块具体用于:将所述人像图片中的人脸表情特征与预设人脸表情特征进行匹配;以及/或者,将所述人像图片中的人体姿态特征与预设人体姿态特征进行匹配。
[0019]作为本专利技术提供的上述系统的一种优选的技术方案,所述匹配模块具体用于:通过预先训练好的卷积神经网络模型将所述人像图片中的人像特征与预设人像特征进行匹配;所述卷积神经网络模型的输入为人像图片,输出为匹配成功的人像特征。
[0020]作为本专利技术提供的上述系统的一种优选的技术方案,所述卷积神经网络模型包括输入层、卷积层、池化层和全连接层;所述卷积神经网络模型的训练过程为:所述输入层接
收经过预处理后得到的所有人像图片样本;其中,所述人像图片样本为包含人脸表情特征和/或人体姿态特征的图片样本;所述卷积层提取所述人像图片样本中的人像特征;所述池化层提取所述人像特征中的感兴趣区域;所述全连接层通过激活函数对所述感兴趣区域中的人脸表情特征和/或人体姿态特征进行分类并输出。
[0021]第三方面,本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有多条程序代码,所述程序代码适于由处理器加载并运行以执行上述任一技术方案中的目标图片抓拍方法。
[0022]第四方面,本专利技术还提供了一种目标图片抓拍装置,包括处理器和存储装置,所述存储装置中存储多条程序代码,所述程序代码适于由所述处理器加载并运行以执行上述任一技术方案中的目标图片抓拍方法。
[0023]本专利技术提供的目标图片抓拍方法、系统、介质及装置,通过先将视频流中的人像图片中任一目标人体的人像特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标图片抓拍方法,其特征在于,所述方法包括:获取视频流中的人像图片;将所述人像图片中任一目标人体的人像特征与预设人像特征进行匹配;根据所述视频流计算与匹配成功的人像特征对应的目标人体在预设时间内的位置变化量;当所述位置变化量在设定的位置变化量阈值范围内时,将包含所述目标人体的人像图片确认为抓拍的目标图片。2.根据权利要求1所述的方法,其特征在于,人像特征包括人脸表情特征和/或人体姿态特征,将所述人像图片中任一目标人体的人像特征与预设人像特征进行匹配的步骤,包括:将所述人像图片中的人脸表情特征与预设人脸表情特征进行匹配;以及/或者将所述人像图片中的人体姿态特征与预设人体姿态特征进行匹配。3.根据权利要求1所述的方法,其特征在于,将所述人像图片中的人像特征与预设人像特征进行匹配的步骤,包括:通过预先训练好的卷积神经网络模型将所述人像图片中的人像特征与预设人像特征进行匹配;所述卷积神经网络模型的输入为人像图片,输出为匹配成功的人像特征。4.根据权利要求3所述的方法,其特征在于,所述卷积神经网络模型包括输入层、卷积层、池化层和全连接层;所述卷积神经网络模型的训练过程为:所述输入层接收经过预处理后得到的所有人像图片样本;其中,所述人像图片样本为包含人脸表情特征和/或人体姿态特征的图片样本;所述卷积层提取所述人像图片样本中的人像特征;所述池化层提取所述人像特征中的感兴趣区域;所述全连接层通过激活函数对所述感兴趣区域中的人脸表情特征和/或人体姿态特征进行分类并输出。5.根据权利要求4所述的方法,其特征在于,所述卷积神经网络模型的训练过程还包括:所述池化层采用注意力模型引入注意力模块SGE,为每个所述人像特征添加注意力因子,以确定所述人像特征的感兴趣区域;所述全连接层采用小波变换函数对所述感兴趣区域进行滤波处理,然后再采用激活函数在所述感兴趣区域中提取人脸表情特征和/或人体姿态特征。6.根据权利要求4所述的方法,其特征在于,所述激活函数包括Sigmod、Tanh、RELU、leaky ReLU和maxout中的任一种;并且/或者,在将所述人像图片中的人像特征与预设人像特征进行匹配时,使用的算法包括CNN、Gabor小波变换和SAE中的至少一种。7.根据权利要求1所述的方法,其特征在于,根据所述视频流计算与匹配成功的人像特征对应的目标...

【专利技术属性】
技术研发人员:蔡明明刘盛中候永顺
申请(专利权)人:四川云从天府人工智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1