目标对象的确定方法、装置、存储介质和处理器制造方法及图纸

技术编号:21362295 阅读:16 留言:0更新日期:2019-06-15 09:31
本发明专利技术公开了一种目标对象的确定方法、装置、存储介质和处理器。该方法包括:获取摄像设备对目标区域拍摄得到的视频文件;对视频文件进行抽帧采样,得到一组视频帧图像;根据一组视频帧图像中的像素点的像素值在一组视频帧图像中确定出多个目标视频帧图像,其中,每个目标视频帧图像用于指示在目标区域中存在运动的对象;对每个目标视频帧图像进行目标对象的检测,得到每个目标视频帧图像的图像特征;根据每个目标视频帧图像的图像特征确定出运动特征;根据运动特征和每个目标视频帧图像的图像特征,确定多个目标视频帧图像中是否出现有目标对象。通过本发明专利技术,达到了提高对目标对象进行确定的效率的技术效果。

Method, device, storage medium and processor for determining target object

The invention discloses a method, a device, a storage medium and a processor for determining a target object. The method includes: acquiring the video files captured by the camera in the target area; sampling the video files to obtain a group of video frame images; determining multiple target video frame images in a group of video frame images according to the pixel values of the pixels in a group of video frame images, in which each target video frame image is used to indicate the presence of motion in the target area. Object; Detecting the target object in each target video frame image to get the image characteristics of each target video frame image; Determining the motion characteristics according to the image characteristics of each target video frame image; Determining whether there are target objects in multiple target video frame images according to the motion characteristics and the image characteristics of each target video frame image. The invention achieves the technical effect of improving the efficiency of determining the target object.

【技术实现步骤摘要】
目标对象的确定方法、装置、存储介质和处理器
本专利技术涉及图像识别领域,具体而言,涉及一种目标对象的确定方法、装置、存储介质和处理器。
技术介绍
目前,在对目标对象进行确定时,主要依赖于防治人员的从业经验和主观判断,需要防治人员具有丰富的经验,才能够准确地在被检查区域中查找和分辨出目标对象活动的痕迹。在相关技术中,会在被检测区域中部署捕捉装置,一段时间后查看捕捉到的目标对象的种类和数量。但需要长期放置捕捉装置,耗费较大人力、物力,并且部署的捕捉设备对被检测区域的美观性和整洁性也有一定影响。另外,还会人工观测是否有目标对象的痕迹(如脚印、粪便等),或者是观看监控视频来观测目标对象,或者是通过热红外摄像头拍摄视频后上传到云服务器来识别目标对象。但是热红外摄像头和云服务器成本高,并且由于运算端在云服务器上,耗费资源大、传输效率低,因而对目标对象进行确定的效率较为低下。在实际应用中,上述方法准确性和针对性较低,且需要较长的监测时间,且准确性差、检疫周期长,并且需要较大的人力成本,因而存在对目标对象进行确定的效率低的问题,难以在实际场景中使用。针对相关技术中对目标对象进行确定的效率低的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术的主要目的在于提供一种目标对象的确定方法、装置、存储介质和处理器,以至少解决对目标对象进行确定的效率低的技术问题。为了实现上述目的,根据本专利技术的一个方面,提供了一种目标对象的确定方法,该方法包括:获取摄像设备对目标区域拍摄得到的视频文件;对视频文件进行抽帧采样,得到一组视频帧图像;根据一组视频帧图像中的像素点的像素值在一组视频帧图像中确定出多个目标视频帧图像,其中,每个目标视频帧图像用于指示在目标区域中存在运动的对象;对每个目标视频帧图像进行目标对象的检测,得到每个目标视频帧图像的图像特征,其中,图像特征用于表示在存在运动的对象中,与目标对象之间的相似度大于目标阈值的对象所在的目标图像区域;根据每个目标视频帧图像的图像特征确定出运动特征,其中,运动特征用于表示多个目标视频帧图像中存在运动的对象的运动速度和运动方向;根据运动特征和每个目标视频帧图像的图像特征,确定多个目标视频帧图像中是否出现有目标对象。可选地,根据一组视频帧图像中的像素点的像素值在一组视频帧图像中确定出多个目标视频帧图像包括:获取一组视频帧图像中的每个像素点的平均像素值;获取一组视频帧图像中的每个视频帧图像中的每个像素点的像素值与对应的平均像素值之间的差值;将一组视频帧图像中差值满足预定条件的视频帧图像确定为目标视频帧图像。可选地,获取一组视频帧图像中的每个视频帧图像中的每个像素点的像素值与对应的平均像素值之间的差值包括:对于一组视频帧图像中的每个视频帧图像中的每个像素点执行以下操作,其中,在执行以下操作时将每个视频帧图像视为当前视频帧图像,将每个像素点视为当前像素点:D(x,y)=|f(x,y)-b(x,y)|,其中,(x,y)为当前像素点在当前视频帧图像中的坐标,f(x,y)表示当前像素点的像素值,b(x,y)表示当前像素点的平均像素值,D(x,y)表示当前像素点的像素值与对应的平均像素值之间的差值。可选地,将一组视频帧图像中差值满足预定条件的视频帧图像确定为目标视频帧图像包括:对于一组视频帧图像中的每个视频帧图像中的每个像素点执行以下操作,其中,在执行以下操作时将每个视频帧图像视为当前视频帧图像,将每个像素点视为当前像素点:其中,D(x,y)表示为当前像素点的像素值与对应的平均像素值之间的差值,T为第一预设阈值;其中,预定条件包括:目标视频帧图像中M(x,y)=1的像素点的个数超过第二预设阈值。可选地,根据每个目标视频帧图像的图像特征确定出运动特征包括:获取与每个目标视频帧图像的图像特征所表示的目标图像区域对应的目标矢量,得到多个目标矢量,其中,每个目标矢量用于表示对应的一个目标视频帧图像中存在运动的对象在经过目标图像区域时的运动速度和运动方向;将多个目标矢量按照每个目标视频帧图像在视频文件中的时间顺序组成第一目标向量,其中,运动特征包括第一目标向量;或者获取与每个目标视频帧图像的图像特征所表示的目标图像区域对应的二维光流图,得到多个二维光流图,其中,每个二维光流图包括对应的一个目标视频帧图像中存在运动的对象在经过目标图像区域时的运动速度和运动方向;将多个二维光流图按照每个目标视频帧图像在视频文件中的时间顺序组成三维第二目标向量,其中,运动特征包括三维第二目标向量。可选地,根据运动特征和每个目标视频帧图像的图像特征,确定多个目标视频帧图像中是否出现有目标对象包括:将运动特征和每个目标视频帧图像的图像特征输入到预先训练好的神经网络模型中,得到对象识别结果,其中,对象识别结果用于表示多个目标视频帧图像中是否出现有目标对象。可选地,将运动特征和每个目标视频帧图像的图像特征输入到预先训练好的神经网络模型中,得到对象识别结果包括:将每个图像特征经过包括卷积层、正则化层和激活函数层的神经网络层结构,得到多个第一特征向量;将多个第一特征向量与运动特征进行融合,得到第二特征向量;将第二特征向量输入到全连接层进行分类,得到第一分类结果,其中,神经网络模型包括神经网络层结构和全连接层,对象识别结果包括第一分类结果,第一分类结果用于表示多个目标视频帧图像中是否出现有目标对象;或者将每个图像特征经过包括卷积层、正则化层和激活函数层的第一神经网络层结构,得到多个第一特征向量;将运动特征经过包括卷积层、正则化层、激活函数层的第二神经网络层结构,得到第二特征向量;将多个第一特征向量与第二特征向量进行融合,得到第三特征向量;将第三特征向量输入到全连接层进行分类,得到第二分类结果,其中,神经网络模型包括第一神经网络层结构、第二神经网络层结构和全连接层,对象识别结果包括第二分类结果,第二分类结果用于表示多个目标视频帧图像中是否出现有目标对象。可选地,对视频文件进行抽帧采样,得到一组视频帧图像包括:对视频文件中的视频序列进行等间隔的抽帧采样,得到一组视频帧图像。可选地,获取摄像设备对目标区域拍摄得到的视频文件包括:获取红外微光夜视摄像头对目标区域拍摄得到的视频文件,其中,视频文件中的视频帧图像为通过红外微光夜视摄像头拍摄到的图像。可选地,在确定多个目标视频帧图像中是否出现有目标对象之后,该方法还包括:在确定出多个目标视频帧图像中出现有目标对象的情况下,确定目标对象在多个目标视频帧图像中的位置;将位置显示在多个目标视频帧图像中。可选地,目标对象的确定方法由设置在本地的服务器执行。为了实现上述目的,根据本专利技术的一个方面,还提供了一种目标对象的确定装置。该装置包括:获取单元,用于获取摄像设备对目标区域拍摄得到的视频文件;采样单元,用于对所述视频文件进行抽帧采样,得到一组视频帧图像;第一确定单元,用于根据所述一组视频帧图像中的像素点的像素值在所述一组视频帧图像中确定出多个目标视频帧图像,其中,每个所述目标视频帧图像用于指示在所述目标区域中存在运动的对象;检测单元,用于对每个所述目标视频帧图像进行目标对象的检测,得到每个所述目标视频帧图像的图像特征,其中,所述图像特征用于表示所述目标视频帧图像中所述存在运动的对象被判定为目标对象时所述存在运动的对本文档来自技高网...

【技术保护点】
1.一种目标对象的确定方法,其特征在于,包括:获取摄像设备对目标区域拍摄得到的视频文件;对所述视频文件进行抽帧采样,得到一组视频帧图像;根据所述一组视频帧图像中的像素点的像素值在所述一组视频帧图像中确定出多个目标视频帧图像,其中,每个所述目标视频帧图像用于指示在所述目标区域中存在运动的对象;对每个所述目标视频帧图像进行目标对象的检测,得到每个所述目标视频帧图像的图像特征,其中,所述图像特征用于表示在所述存在运动的对象中,与所述目标对象之间的相似度大于目标阈值的对象所在的目标图像区域;根据每个所述目标视频帧图像的图像特征确定出运动特征,其中,所述运动特征用于表示所述多个目标视频帧图像中所述存在运动的对象的运动速度和运动方向;根据所述运动特征和每个所述目标视频帧图像的图像特征,确定所述多个目标视频帧图像中是否出现有所述目标对象。

【技术特征摘要】
1.一种目标对象的确定方法,其特征在于,包括:获取摄像设备对目标区域拍摄得到的视频文件;对所述视频文件进行抽帧采样,得到一组视频帧图像;根据所述一组视频帧图像中的像素点的像素值在所述一组视频帧图像中确定出多个目标视频帧图像,其中,每个所述目标视频帧图像用于指示在所述目标区域中存在运动的对象;对每个所述目标视频帧图像进行目标对象的检测,得到每个所述目标视频帧图像的图像特征,其中,所述图像特征用于表示在所述存在运动的对象中,与所述目标对象之间的相似度大于目标阈值的对象所在的目标图像区域;根据每个所述目标视频帧图像的图像特征确定出运动特征,其中,所述运动特征用于表示所述多个目标视频帧图像中所述存在运动的对象的运动速度和运动方向;根据所述运动特征和每个所述目标视频帧图像的图像特征,确定所述多个目标视频帧图像中是否出现有所述目标对象。2.根据权利要求1所述的方法,其特征在于,根据所述一组视频帧图像中的像素点的像素值在所述一组视频帧图像中确定出多个目标视频帧图像包括:获取所述一组视频帧图像中的每个像素点的平均像素值;获取所述一组视频帧图像中的每个视频帧图像中的每个像素点的像素值与对应的所述平均像素值之间的差值;将所述一组视频帧图像中所述差值满足预定条件的视频帧图像确定为所述目标视频帧图像。3.根据权利要求2所述的方法,其特征在于,获取所述一组视频帧图像中的每个视频帧图像中的每个像素点的像素值与对应的所述平均像素值之间的差值包括:对于所述一组视频帧图像中的每个视频帧图像中的每个像素点执行以下操作,其中,在执行以下操作时将所述每个视频帧图像视为当前视频帧图像,将所述每个像素点视为当前像素点:D(x,y)=|f(x,y)-b(x,y)|其中,(x,y)为所述当前像素点在所述当前视频帧图像中的坐标,f(x,y)表示所述当前像素点的像素值,b(x,y)表示所述当前像素点的所述平均像素值,D(x,y)表示所述当前像素点的像素值与对应的所述平均像素值之间的差值。4.根据权利要求2或3所述的方法,其特征在于,将所述一组视频帧图像中所述差值满足预定条件的视频帧图像确定为所述目标视频帧图像包括:对于所述一组视频帧图像中的每个视频帧图像中的每个像素点执行以下操作,其中,在执行以下操作时将所述每个视频帧图像视为当前视频帧图像,将所述每个像素点视为当前像素点:其中,D(x,y)表示为所述当前像素点的像素值与对应的所述平均像素值之间的差值,所述T为第一预设阈值;其中,所述预定条件包括:所述目标视频帧图像中M(x,y)=1的像素点的个数超过第二预设阈值。5.根据权利要求1所述的方法,其特征在于,根据每个所述目标视频帧图像的图像特征确定出运动特征包括:获取与每个所述目标视频帧图像的图像特征所表示的目标图像区域对应的目标矢量,得到多个目标矢量,其中,每个所述目标矢量用于表示对应的一个所述目标视频帧图像中所述存在运动的对象在经过所述目标图像区域时的运动速度和运动方向;将所述多个目标矢量按照每个所述目标视频帧图像在所述视频文件中的时间顺序组成第一目标向量,其中,所述运动特征包括所述第一目标向量;或者获取与每个所述目标视频帧图像的图像特征所表示的目标图像区域对应的二维光流图,得到多个二维光流图,其中,每个所述二维光流图包括对应的一个所述目标视频帧图像中所述存在运动的对象在经过所述目标图像区域时的运动速度和运动方向;将所述多个二维光流图按照每个所述目标视频帧图像在所述视频文件中的时间顺序组成三维第二目标向量,其中,所述运动特征包括所述三维第二目标向量。6.根据权利要求1所述的方法,其特征在于,根据所...

【专利技术属性】
技术研发人员:徐晨鑫张娅徐宝臣吴明辉
申请(专利权)人:上海媒智科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1