目标检测方法、系统、设备及存储介质技术方案

技术编号:27657497 阅读:22 留言:0更新日期:2021-03-12 14:21
本发明专利技术提供了一种目标检测方法、系统、设备及存储介质,所述方法包括:获取待检测的视频数据,将所述待检测的视频数据中的初始图像输入目标检测模型,获取所述目标检测模型输出的热图和边界框偏移向量;根据所述热图确定多个类别的关键点位置,根据所述关键点位置和所述边界框偏移向量计算检测到的各个关键点对应的边界框;对于同一目标的多个关键点对应的边界框进行去重处理,去重后得到的边界框为检测到的目标边界框。通过采用本发明专利技术,基于多个类别的人体关键点进行检测,可以避免现有技术中心点不明确而导致检测不准确的问题。

【技术实现步骤摘要】
目标检测方法、系统、设备及存储介质
本专利技术涉及数据处理
,尤其涉及一种目标检测方法、系统、设备及存储介质。
技术介绍
随着社会经济的发展,现代人的生活节奏越来越快,陪伴、监护孩子的时间越来越少,幼儿园承担了一部分儿童看护工作。目前的视频监控系统并没有针对幼儿园的特殊场景实现智能监护功能。一些智能监控系统所实现的行为分析功能,如摔倒检测系统等,往往是借助运动学传感器,穿戴不便,而基于视频的方法通常借助于人体关键点,需要keniect摄像机或关键点检测算法,造价昂贵,且准确率依赖于关键点检测算法,存在技术瓶颈。现有技术中基于热图的目标检测一般是采用一个物体中心点热图来进行目标检测,然而对于人员检测来说,由于遮挡、衣服多样性的问题,人体中心位置存在语义模糊的特点,因此不能很好地表示人员位置信息,影响边界框计算精度。
技术实现思路
针对现有技术中的问题,本专利技术的目的在于提供一种目标检测方法、系统、设备及存储介质,基于多个类别的人体关键点进行检测,可以避免现有技术中心点不明确而导致检测不准确的问题。本专利技术实施例提供一种目标检测方法,包括如下步骤:获取待检测的视频数据,将所述待检测的视频数据中的初始图像输入目标检测模型,获取所述目标检测模型输出的热图和边界框偏移向量;根据所述热图确定多个类别的关键点位置,根据所述关键点位置和所述边界框偏移向量计算检测到的各个关键点对应的边界框;对于同一目标的多个关键点对应的边界框进行去重处理,去重后得到的边界框为检测到的目标边界框。本专利技术的目标检测方法通过目标检测模型来获取热图和边界框偏移向量,其中热图中包括多个类别的关键点位置,因此,对于同一个目标,可能会检测到多个关键点位置,由此会得到多个边界框,因此,需要对同一目标的多个关键点对应的边界框进行去重处理,从而确定每个目标对应的目标边界框,避免了现有技术中心点不明确而导致检测不准确的问题,提高了目标检测准确性。在一些实施例中,所述方法还包括训练目标检测模型,包括如下步骤:基于训练样本图像中多个类别的关键点位置生成关键点热图标签;基于训练样本图像和所述关键点热图标签训练所述目标检测模型。在一些实施例中,所述方法还包括训练目标检测模型,包括如下步骤:构建初始目标检测模型;基于第一图像集中的第一图像和对应的关键点热图标签以迭代方式预训练所述初始目标检测模型,得到预训练目标检测模型;将第二图像集中的第二图像输入所述预训练目标检测模型,根据所述预训练目标检测模型的输出为所述第二图像的添加预分类标签;获取所述预训练目标检测模型对应于所述第二图像的输出的修正标签;基于所述预分类标签和所述修正标签为所述第二图像添加关键点热图标签,基于所述第二图像集和标注后的第二图像迭代训练所述预训练目标检测模型,得到训练完成的目标检测模型。在一些实施例中,所述对于同一目标的多个关键点对应的边界框进行去重处理之后,还包括如下步骤:根据目标边界框从所对应的初始图像中抠取目标图像;将所述目标图像输入目标姿态分类模型,获取所述目标姿态分类模型输出的姿态类别。在一些实施例中,还包括训练目标姿态分类模型,包括如下步骤:构建初始目标姿态分类模型;基于第三图像集和所述第三图像集中的第三图像的姿态类别标签,以迭代方式预训练所述初始目标姿态分类模型,得到预训练目标姿态分类模型;将第四图像集中的第四图像输入预训练目标姿态分类模型,根据所述预训练目标姿态分类模型的输出为所述第四图像添加预分类标签;获取所述预训练目标姿态分类模型对应于所述第四图像的输出的修正标签;基于所述预分类标签和所述修正标签为所述第四图像添加姿态类别标签,基于所述第四图像集和标注后的第四图像迭代训练所述目标姿态分类模型。在一些实施例中,还包括如下步骤:将待检测的视频数据输入视频动作分类模型,所述视频动作分类模型包括3D特征提取器,所述3D特征提取器的输入数据包括视频数据;获取所述视频动作分类模型输出的动作类别。在一些实施例中,还包括训练视频动作分类模型,包括如下步骤:构建初始视频动作分类模型;基于第一视频集和所述第一视频集中第一视频的视频类别标签,以迭代方式预训练所述初始视频动作分类模型,得到预训练视频动作分类模型;将第二视频集中的第二视频输入预训练视频动作分类模型,根据所述预训练视频动作分类模型的输出为所述第二视频添加预分类标签;获取所述预训练视频动作分类模型对应于所述第二视频的输出的修正标签;基于所述预分类标签和所述修正标签为所述第二视频添加视频类别标签,基于所述第二视频集和标注后的第二视频迭代训练所述预训练视频动作分类模型,得到训练完成的视频动作分类模型。在一些实施例中,将第二视频集中的第二视频输入预训练视频动作分类模型,根据所述预训练视频动作分类模型的输出为所述第二视频添加预分类标签,包括如下步骤:将第二视频集中的第二视频输入预训练视频动作分类模型,对所述第二视频进行M次预测,M为大于1的整数;获取所述预训练视频动作分类模型对应于所述第二视频的M次预测结果;分析所述M次预测结果,判断所述M次预测结果中是否存在一动作类别,其置信度大于第一阈值的预测次数大于第二阈值;如果是,则根据该动作类别为所述第二视频的添加预标注标签。在一些实施例中,所述将第二视频集中的第二视频输入预训练视频动作分类模型,包括如下步骤:获取第二视频,按照预设的采样间隔对所述第二视频中的图像帧进行采样,并将采样得到的图像帧存储于帧缓存队列中;所述帧缓存队列中的帧数达到预设的缓存帧数阈值时,将所述帧缓存队列输入预训练视频动作分类模型。本专利技术实施例还提供一种目标检测系统,应用于所述的目标检测方法,所述系统包括:模型检测模块,用于获取待检测的视频数据,将所述待检测的视频数据中的初始图像输入目标检测模型,获取所述目标检测模型输出的热图和边界框偏移向量;边界框计算模块,用于根据所述热图确定多个类别的关键点位置,根据所述关键点位置和所述边界框偏移向量计算检测到的各个关键点对应的边界框;目标确定模块,用于对于同一目标的多个关键点对应的边界框进行去重处理,去重后得到的边界框为检测到的目标边界框。本专利技术的目标检测系统中,所述模型检测模块通过目标检测模型来获取热图和边界框偏移向量,其中热图中包括多个类别的关键点位置,因此,对于同一个目标,可能会检测到多个关键点位置,由此所述边界框计算模块会计算得到多个边界框,因此,需要所述目标确定模块对同一目标的多个关键点对应的边界框进行去重处理,从而确定每个目标对应的目标边界框,避免了现有技术中心点不明确而导致检测不准确的问题,提高了目标检测准确性。本专利技术实施例还提供一种目标检测设备,包括:处理器;存储器,其中存储有所述处理器的可执行指令;其中,所述处理器配置为经本文档来自技高网...

【技术保护点】
1.一种目标检测方法,其特征在于,包括如下步骤:/n获取待检测的视频数据,将所述待检测的视频数据中的初始图像输入目标检测模型,获取所述目标检测模型输出的热图和边界框偏移向量;/n根据所述热图确定多个类别的关键点位置,根据所述关键点位置和所述边界框偏移向量计算检测到的各个关键点对应的边界框;/n对于同一目标的多个关键点对应的边界框进行去重处理,去重后得到的边界框为检测到的目标边界框。/n

【技术特征摘要】
1.一种目标检测方法,其特征在于,包括如下步骤:
获取待检测的视频数据,将所述待检测的视频数据中的初始图像输入目标检测模型,获取所述目标检测模型输出的热图和边界框偏移向量;
根据所述热图确定多个类别的关键点位置,根据所述关键点位置和所述边界框偏移向量计算检测到的各个关键点对应的边界框;
对于同一目标的多个关键点对应的边界框进行去重处理,去重后得到的边界框为检测到的目标边界框。


2.根据权利要求1所述的目标检测方法,其特征在于,还包括训练目标检测模型,包括如下步骤:
基于训练样本图像中多个类别的关键点位置生成关键点热图标签;
基于训练样本图像和所述关键点热图标签训练所述目标检测模型。


3.根据权利要求1所述的目标检测方法,其特征在于,还包括训练目标检测模型,包括如下步骤:
构建初始目标检测模型;
基于第一图像集中的第一图像和对应的关键点热图标签以迭代方式预训练所述初始目标检测模型,得到预训练目标检测模型;
将第二图像集中的第二图像输入所述预训练目标检测模型,根据所述预训练目标检测模型的输出为所述第二图像的添加预分类标签;
获取所述预训练目标检测模型对应于所述第二图像的输出的修正标签;
基于所述预分类标签和所述修正标签为所述第二图像添加关键点热图标签,基于所述第二图像集和标注后的第二图像迭代训练所述预训练目标检测模型,得到训练完成的目标检测模型。


4.根据权利要求1所述的目标检测方法,其特征在于,所述对于同一目标的多个关键点对应的边界框进行去重处理之后,还包括如下步骤:
根据目标边界框从所对应的初始图像中抠取目标图像;
将所述目标图像输入目标姿态分类模型,获取所述目标姿态分类模型输出的姿态类别。


5.根据权利要求4所述的目标检测方法,其特征在于,还包括训练目标姿态分类模型,包括如下步骤:
构建初始目标姿态分类模型;
基于第三图像集和所述第三图像集中的第三图像的姿态类别标签,以迭代方式预训练所述初始目标姿态分类模型,得到预训练目标姿态分类模型;
将第四图像集中的第四图像输入预训练目标姿态分类模型,根据所述预训练目标姿态分类模型的输出为所述第四图像添加预分类标签;
获取所述预训练目标姿态分类模型对应于所述第四图像的输出的修正标签;
基于所述预分类标签和所述修正标签为所述第四图像添加姿态类别标签,基于所述第四图像集和标注后的第四图像迭代训练所述目标姿态分类模型,得到训练完成的目标姿态分类模型。


6.根据权利要求1所述的目标检测方法,其特征在于,还包括如下步骤:
将待检测的视频数据输入视频动作分类模型,所述视频动作分类模型包括3D特征提取器,所述3D特征提取器的输入数据包括视频数据;
获取所述视频动作分类模型输出的动作类别。

【专利技术属性】
技术研发人员:尹泽强熊超孙新章勇曹李军
申请(专利权)人:苏州科达特种视讯有限公司苏州科达科技股份有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1