【技术实现步骤摘要】
基于改进YOLOv5
‑
L的宠物犬视频目标检测方法及系统
[0001]本专利技术涉及视频目标检测
,更具体地,涉及一种基于改进YOLOv5
‑
L的宠物犬视频目标检测方法及系统。
技术介绍
[0002]当前社会,宠物犬已经是很多人共同生活的伙伴,人们为了消除孤寂或出于娱乐目的而豢养它们,宠物犬是一种灵性、聪明的动物,它们在经过人类驯化以后,动作敏捷,善解人意,忠诚主人,同时理解宠物犬的动作行为也是一项重要的研究工作。
[0003]目标检测是目前计算机视觉领域的热点,传统的分类任务一般只关心整体,得到的是一张图像的内容描述,而目标检测任务则不同,目标检测关注的是特定的物体目标,目标检测需要的是从背景中提取出感兴趣的目标,并确定这一目标的位置,因而目标检测输出的是一个列表,包含目标的类别和位置。现有的目标检测算法一般分为两种:two
‑
stage检测模型和one
‑
stage检测模型。two
‑
stage检测模型先进行区域生成,该区域称之为region proposal,在通过卷积网络进行样本的分类,常用的two
‑
stage检测模型有R
‑
CNN、SPP
‑
Net、fast R
‑
CNN等。one
‑
stage检测模型则不需要生成region proposal,直接从输入数据中提取特征,直接预测物体的类别和位置信息,常用的算法有: ...
【技术保护点】
【技术特征摘要】
1.一种基于改进YOLOv5
‑
L的宠物犬视频目标检测方法,其特征在于,包括如下步骤:基于获取到的包含宠物犬图像数据和获取到的包含宠物犬的视频数据分别构建初始训练集测试集;对所述包含宠物犬的视频进行帧提取,得到帧图像;对所述初始训练集进行预处理,得到最终训练集;改进YOLOv5
‑
L模型并进行训练,具体为:搭建BackBone网络,改进Pred模块,在BackBone网络后加入SK注意力机制;设置训练参数,对改进后的YOLOv5
‑
L模型进行训练,保存最佳权重参数文件;将所述最佳权重参数文件放入检测器中,对所述最终测试集中视频进行检测,保存所有检测到宠物犬的视频帧,使用AP指标对检测结果进行评估,进而得到最佳改进YOLOv5
‑
L模型;将待测宠物犬视频输入最佳YOLOv5
‑
L模型,得到相应的检测结果。2.根据权利要求1所述基于改进YOLOv5
‑
L的宠物犬视频目标检测方法,其特征在于,所述构建初始训练集和测试集,包括以下步骤:基于获取到的包含宠物犬图像数据,得到所有已标注的宠物犬图片;带有不同背景噪声的宠物犬图片,使用LabelImg标注工具对所有图片进行标注,得到已标注的宠物犬图片,其中所述不同背景噪声至少包括草地、雪山、屋内及街道中的一种或几种;将所述已标注的宠物犬图片合并为初始训练集;在视频网站搜集人与宠物犬互动的视频,使用4KVideo工具进行下载保存;裁剪保存的视频,使原视频拆分为3s
‑
10s的短视频,保存所有短视频得到测试集。3.根据权利要求1所述基于改进YOLOv5
‑
L的宠物犬视频目标检测方法,其特征在于,所述对测试集中的视频进行帧提取和对初始训练集进行预处理,包括以下步骤:通过extractor算法对测试集中视频进行逐帧提取,保存所有视频帧图像;从所述视频帧图像中选取部分宠物犬形态异常和运动模糊的图片并进行标注,得到标注图片;随机选取若干所述标注图片进行左右平移、多图叠加及比例缩放,得到多种形态特征的已处理标注图片;将所述已处理标注图片和所述初始训练集进行合并得到最终训练集。4.根据权利要求1所述基于改进YOLOv5
‑
L的宠物犬视频目标检测方法,其特征在于,所述搭建BackBone网络包括下采样模块、CBR模块、Res模块、CSP_X模块;所述下采样模块;采用split算法将640像素*640像素RGB图像切分为12通道特征图,通过卷积得到64通道特征图;所述CBR模块;包括3*3卷积层、正则化层及Relu函数;所述Res模块;包括两个CBR模块和空层残差并且相互连接;所述CSP_X模块;用于提取特征,包括相互连接的CBR模块、X个Res模块及空层残差,其中,X表示个数。5.根据权利要求1所述基于改进YOLOv5
‑
...
【专利技术属性】
技术研发人员:黄步添,汪志刚,刘振广,焦颖颖,许曼迪,
申请(专利权)人:杭州云象网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。