当前位置: 首页 > 专利查询>清华大学专利>正文

基于图像检测的动作识别数据集生成方法及装置制造方法及图纸

技术编号:28421981 阅读:37 留言:0更新日期:2021-05-11 18:29
本发明专利技术提供了一种基于图像检测的动作识别数据集生成方法及装置,基于图像检测的动作识别数据集生成方法包括:确定预先采集的动作视频中每一帧中所有待检测目标的检测矩形;在所述每一帧中的每一待检测目标的检测矩形中进行标记;按照第一预设范围对所述每一帧进行裁剪;组装裁剪后的多帧,以生成动作视频数据或图像序列。本发明专利技术提供的基于图像检测的动作识别数据集生成方法及装置,较好的解决了现有技术中,针对建立识别目标动作专用的视频数据集耗时耗力的问题。

【技术实现步骤摘要】
基于图像检测的动作识别数据集生成方法及装置
本专利技术涉及计算机视觉处理
,特别是涉及动作检测类机器学习模型的训练数据集生成技术,具体涉及一种基于图像检测的动作识别数据集生成方法及装置。
技术介绍
计算机视觉(computervision,CV)技术发展了数十载,在2012年出现了一个重要的分水岭,那就是深度学习技术的应用及带来的突破。机器已经可以识别图像了,会分辨猫、狗、汽车、红绿灯等等静态图片,而感知动态行为可能是机器如何理解这个世界的一个巨大进步。这就是计算机视觉领域的视频理解任务。而视频理解,更核心的可以归为动作的理解。对人、动物以及人生产出来的机械设备的动作的理解,也就是动作识别ActionRecognition,是指对视频中人的行为动作进行识别,即读懂视频。可以理解的是,在深度学习领域,数据集的重要性与算法可以相提并论。一个大规模的、鲁棒性好的、泛化能力强的、标注质量高的数据集,对于整个领域的发展,包括算法的提升改进、新算法的提出等都有极大的促进作用。图像和视频的数据集的建立,在CV领域更是重要。本领域本文档来自技高网...

【技术保护点】
1.一种基于图像检测的动作识别数据集生成方法,其特征在于,包括:/n确定预先采集的动作视频中每一帧中所有待检测目标的检测矩形;/n在所述每一帧中的每一待检测目标的检测矩形中进行标记;/n按照第一预设范围对所述每一帧进行裁剪;/n组装裁剪后的多帧,以生成动作视频数据或图像序列。/n

【技术特征摘要】
1.一种基于图像检测的动作识别数据集生成方法,其特征在于,包括:
确定预先采集的动作视频中每一帧中所有待检测目标的检测矩形;
在所述每一帧中的每一待检测目标的检测矩形中进行标记;
按照第一预设范围对所述每一帧进行裁剪;
组装裁剪后的多帧,以生成动作视频数据或图像序列。


2.如权利要求1所述的基于图像检测的动作识别数据集生成方法,其特征在于,所述确定预先采集的动作视频中每一帧中所有待检测目标的检测矩形,包括:
利用CV算法,确定所述每一帧的检测矩形的初步形心位置;
根据所述初步形心位置确定当前帧的检测矩形的最终形心位置;
根据第二预设范围以及所述最终形心位置确定所述当前帧的检测矩形。


3.如权利要求2所述的基于图像检测的动作识别数据集生成方法,其特征在于,所述根据所述初步形心位置确定当前帧的检测矩形的最终形心位置,包括:
在时间域上,根据当前帧的检测矩形的初步形心位置以及当前帧附近多个帧的检测矩形的初步形心位置,确定所述当前帧的检测矩形的最终形心位置。


4.如权利要求1所述的基于图像检测的动作识别数据集生成方法,其特征在于,还包括:
在所述动作视频中对所有待检测目标的进行动作识别标注;
根据组装所得的视频/图像序列,以及对应的标注数据生成动作识别数据集;
所述在所述动作视频中对所有待检测目标的进行动作识别标注包括:
根据裁剪的计算规则及裁剪时裁剪规则所使用的参数生成标注信息;
根据所述标注信息进行动作识别标注。


5.一种基于图像检测的动作识别数据集生成装置,其特征在于,包括:
检测矩形确定单元,用于确定预先采集的动作视频中每一帧中所有待检测目标的检测矩形;
帧标记单元,用于在所述每一帧中的每一待检测目标的检测矩形中进行标记;

【专利技术属性】
技术研发人员:周力安雪晖刘祖光李鹏飞李志伟
申请(专利权)人:清华大学重庆交通大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1