【技术实现步骤摘要】
一种人-物交互检测数据集的构建方法
本专利技术属于机器视觉处理
,涉及数据集的构建方法,具体涉及一种人-物交互检测数据集的构建方法,可用于作为训练人-物交互检测神经网络的类似场景。
技术介绍
信息时代发展下,摄像头及各种图像视频采集设备可以获得各个场景的画面,许多场景都需要对画面中的人-物交互进行检测。现有的人-物交互检测方法主要为基于深度学习的方法,而基于深度学习的人-物交互检测方法多为数据驱动方法,数据集构建的好坏对基于深度学习的人-物交互检测方法的检测精度至关重要,但由于数据集中的图像之间缺少因果关系,无法为基于深度学习的人-物交互检测方法提供推理人-物动态交互类别所需的因果信息,导致人-物交互检测精度较差。例如,密歇根大学的Yu-WeiChao,YunfanLiu,XieyangLiu,JiaDeng和华盛顿大学的HuayiZeng在2018年IEEEWinterConferenceonApplicationsofComputerVision上发表了论文“LearningtoDetectHuman-Ob ...
【技术保护点】
1.一种人-物交互检测数据集的构建方法,其特征在于,包括如下步骤:/n(1)设置构建人-物交互检测数据集所需的参数:/n设置构建人-物交互检测数据集所需的参数,包括待检测人的类别编号、待检测物体的类别编号、待检测人-物动态交互的类别编号、场景S及场景编号、需采集的人员数量及人员编号、采集设备C及设备编号,S={S
【技术特征摘要】
1.一种人-物交互检测数据集的构建方法,其特征在于,包括如下步骤:
(1)设置构建人-物交互检测数据集所需的参数:
设置构建人-物交互检测数据集所需的参数,包括待检测人的类别编号、待检测物体的类别编号、待检测人-物动态交互的类别编号、场景S及场景编号、需采集的人员数量及人员编号、采集设备C及设备编号,S={S1,S2,...,Si,...,Sn},Si表示第i个场景,n表示场景总数,n≥2,C={C1,C2,...,Cj,...,Cm},Cj表示第j个采集设备,m表示采集设备的总数,m≥1;
(2)采集每个场景Si的原始视频并进行剪辑:
(2a)通过每个采集设备Cj对每个场景Si进行采集,得到场景S的原始视频集合V={V1,V2,...,Vi,...,Vn},其中,Vi表示m个采集设备对场景Si进行采集所得到的原始视频,Vi={Vi1,Vi2,...,Vij,...,Vim},Vij表示采集设备Cj对场景Si进行采集所得到的原始视频;
(2b)将每个原始视频Vij剪辑为lij个视频段,得到场景S的原始视频段集合V'={V'1,V'2,...,V'i,...,V'n},其中,V'i表示Si的原始视频段,V'i={V'i1,V'i2,...,V'ij,...,V'im},V'ij表示Vij对应的原始视频段,表示总帧数为且仅包含一个人员的一个人-物动态交互类别的第kij个视频段,lij≥5,
(3)获取原始视频段集合V'的总图像集合P:
以为帧间隔对每个视频段进行帧提取,得到原始视频段集合V'的总图像集合P={P1,P2,...,Pi,...,Pn},其中,Pi表示原始视频段V'i的图像集合,Pi={Pi1,Pi2,...,Pij,...,Pim},Pij表示原始视频段V'ij的图像表示对视频段进行帧提取得到的分图像集合,表示第dij张图像,表示总图像数,
(4)获取命名总图像集合P'及其总标注文件集合x:
(4a)对每张图像进行命名,得到总图像集合P的命名总图像集合P'={P'1,P'2,...,P'i,...,P'n},其中,P'i表示图像集合Pi的命名图像集合,P'i={P'i1,P'i2,...,P'ij,...,P'im},P'ij表示图像Pij的命名图像,表示分图像集合的命名分图像集合,表示对图像命名得到的命名图像;
(4b)对每张命名...
【专利技术属性】
技术研发人员:谢雪梅,李启越,金星,李科正,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。