目标检测方法、系统、设备及存储介质技术方案

技术编号：27657497 阅读：22 留言：0更新日期：2021-03-12 14:21

本发明专利技术提供了一种目标检测方法、系统、设备及存储介质，所述方法包括：获取待检测的视频数据，将所述待检测的视频数据中的初始图像输入目标检测模型，获取所述目标检测模型输出的热图和边界框偏移向量；根据所述热图确定多个类别的关键点位置，根据所述关键点位置和所述边界框偏移向量计算检测到的各个关键点对应的边界框；对于同一目标的多个关键点对应的边界框进行去重处理，去重后得到的边界框为检测到的目标边界框。通过采用本发明专利技术，基于多个类别的人体关键点进行检测，可以避免现有技术中心点不明确而导致检测不准确的问题。

全部详细技术资料下载

【技术实现步骤摘要】
目标检测方法、系统、设备及存储介质
本专利技术涉及数据处理
，尤其涉及一种目标检测方法、系统、设备及存储介质。
技术介绍
随着社会经济的发展，现代人的生活节奏越来越快，陪伴、监护孩子的时间越来越少，幼儿园承担了一部分儿童看护工作。目前的视频监控系统并没有针对幼儿园的特殊场景实现智能监护功能。一些智能监控系统所实现的行为分析功能，如摔倒检测系统等，往往是借助运动学传感器，穿戴不便，而基于视频的方法通常借助于人体关键点，需要keniect摄像机或关键点检测算法，造价昂贵，且准确率依赖于关键点检测算法，存在技术瓶颈。现有技术中基于热图的目标检测一般是采用一个物体中心点热图来进行目标检测，然而对于人员检测来说，由于遮挡、衣服多样性的问题，人体中心位置存在语义模糊的特点，因此不能很好地表示人员位置信息，影响边界框计算精度。
技术实现思路
针对现有技术中的问题，本专利技术的目的在于提供一种目标检测方法、系统、设备及存储介质，基于多个类别的人体关键点进行检测，可以避免现有技术中心点不明确而导致检测不准确的问题。本专利技术实施例提供一种目标检测方法，包括如下步骤：获取待检测的视频数据，将所述待检测的视频数据中的初始图像输入目标检测模型，获取所述目标检测模型输出的热图和边界框偏移向量；根据所述热图确定多个类别的关键点位置，根据所述关键点位置和所述边界框偏移向量计算检测到的各个关键点对应的边界框；对于同一目标的多个关键点对应的边界框进行去重处理，去重后得到的边界框为检测到的目标边...

【技术保护点】
1.一种目标检测方法，其特征在于，包括如下步骤：/n获取待检测的视频数据，将所述待检测的视频数据中的初始图像输入目标检测模型，获取所述目标检测模型输出的热图和边界框偏移向量；/n根据所述热图确定多个类别的关键点位置，根据所述关键点位置和所述边界框偏移向量计算检测到的各个关键点对应的边界框；/n对于同一目标的多个关键点对应的边界框进行去重处理，去重后得到的边界框为检测到的目标边界框。/n

【技术特征摘要】
1.一种目标检测方法，其特征在于，包括如下步骤：
获取待检测的视频数据，将所述待检测的视频数据中的初始图像输入目标检测模型，获取所述目标检测模型输出的热图和边界框偏移向量；
根据所述热图确定多个类别的关键点位置，根据所述关键点位置和所述边界框偏移向量计算检测到的各个关键点对应的边界框；
对于同一目标的多个关键点对应的边界框进行去重处理，去重后得到的边界框为检测到的目标边界框。

2.根据权利要求1所述的目标检测方法，其特征在于，还包括训练目标检测模型，包括如下步骤：
基于训练样本图像中多个类别的关键点位置生成关键点热图标签；
基于训练样本图像和所述关键点热图标签训练所述目标检测模型。

3.根据权利要求1所述的目标检测方法，其特征在于，还包括训练目标检测模型，包括如下步骤：
构建初始目标检测模型；
基于第一图像集中的第一图像和对应的关键点热图标签以迭代方式预训练所述初始目标检测模型，得到预训练目标检测模型；
将第二图像集中的第二图像输入所述预训练目标检测模型，根据所述预训练目标检测模型的输出为所述第二图像的添加预分类标签；
获取所述预训练目标检测模型对应于所述第二图像的输出的修正标签；
基于所述预分类标签和所述修正标签为所述第二图像添加关键点热图标签，基于所述第二图像集和标注后的第二图像迭代训练所述预训练目标检测模型，得到训练完成的目标检测模型。

4.根据权利要求1所述的目标检测方法，其特征在于，所述对于同一目标的多个关键点对应的边界框进行去重处理之后，还包括如下步骤：
根据目标边界框从所对应的初始图像中抠取目标图像；
将所述目标图像输入目标姿态分类模型，获取所述目标姿态分类模型输出的姿态类别。

5.根据权利要求4所述的目标检测方法，其特征在于，还包括训练目标姿态分类模型，包括如下步骤：
构建初始目标姿态分类模型；
基于第三图像集和所述第三图像集中的第三图像的姿态类别标签，以迭代方式预训练所述初始目标姿态分类模型，得到预训练目标姿态分类模型；
将第四图像集中的第四图像输入预训练目标姿态分类模型，根据所述预训练目标姿态分类模型的输出为所述第四图像添加预分类标签；
获取所述预训练目标姿态分类模型对应于所述第四图像的输出的修正标签；
基于所述预分类标签和所述修正标签为所述第四图像添加姿态类别标签，基于所述第四图像集和标注后的第四图像迭代训练所述目标姿态分类模型，得到训练完成的目标姿态分类模型。

6.根据权利要求1所述的目标检测方法，其特征在于，还包括如下步骤：
将待检测的视频数据输入视频动作分类模型，所述视频动作分类模型包括3D特征提取器，所述3D特征提取器的输入数据包括视频数据；
获取所述视频动作分类模型输出的动作类别。

【专利技术属性】
技术研发人员：尹泽强，熊超，孙新，章勇，曹李军，
申请(专利权)人：苏州科达特种视讯有限公司，苏州科达科技股份有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人