无人机航拍视频内容识别方法、装置及系统制造方法及图纸

技术编号：26971480 阅读：55 留言：0更新日期：2021-01-06 00:02

本发明专利技术公开了一种基于深度学习的无人机航拍视频内容识别方法，包括：实时获取无人机拍摄的视频图像；对视频图像进行抽帧处理以提取样本图像，对样本图像进行预处理；对样本图像中的待识别物体进行标注，生成物体类别数据库；利用数据增强技术扩充物体类别数据库；利用扩充后的物体类别数据库训练深度神经网络模型，深度神经网络模型为SSD网络模型，SSD网络模型包括多分支卷积结构及多尺度特征图融合结构；使用训练好的深度神经网络模型识别视频图像，以输出每个物体类别的位置信息与尺寸信息。本发明专利技术还公开了一种基于深度学习的无人机航拍视频内容识别装置及系统。采用本发明专利技术可有效解决航拍视频物体检测中存在的类别识别和位置定位相互影响的问题。

全部详细技术资料下载

【技术实现步骤摘要】
无人机航拍视频内容识别方法、装置及系统
本专利技术涉及图像识别
，尤其涉及一种基于深度学习的无人机航拍视频内容识别方法、装置及系统。
技术介绍
近年来，随着计算机技术、多媒体技术和网络技术的不断发展，手机、摄像机、监控等获取视频的设备快速普及，视频资源日益丰富。快速并且准确地获取视频中的信息越来越重要，而基于深度学习的方法蕴藏着巨大的潜能，在计算机视觉领域的应用发展如火如荼，成为当今及未来的趋势。更进一步，实时准确地检测定位视频中的场景文本并进行物体识别，对治安监控安防、无人机飞行、自动驾驶等场景有着重要的应用。对于视频内容的理解和识别等工作，过去都是通过人工手段来完成，这无疑是费时费力且低效的一种方式，近年来国内外学者提出了很多提取视觉特征的深度神经网络模型，同时部分学者开始研究深度神经网络在视频领域的应用，提出了一些用于视频动作识别和特征提取的网络；在视频内容检索方面目前也引入了深度神经网络用于从视频中提取结构化信息。到目前为止，深度卷积神经网络己经是目标检测算法的通用方法，目前高性能的物体检测算法和最新的研究也都是基于深度卷积神经网络。为了提高目标检测网络的速度，Liu等人提出了SSD网络该网络通过在不同尺寸的特征图上进行目标类别分类和位置回归，利用不同的尺寸特征图来检测不同尺寸的目标，省去了RPN网络从而大大提高了网络的速度；更进一步，Redmon等人提出了YOLO网络，该网络将原图分成了7x7大小的区域，对每个区域直接通过神经网络进行目标类别分类和位置回归，省去了不同尺寸特征图的分类和...

【技术保护点】
1.一种基于深度学习的无人机航拍视频内容识别方法，其特征性在于，包括：/n实时获取无人机拍摄的视频图像；/n对所述视频图像进行抽帧处理以提取样本图像，对所述样本图像进行预处理；/n对所述样本图像中的待识别物体进行标注，生成物体类别数据库；/n利用数据增强技术扩充所述物体类别数据库；/n利用扩充后的物体类别数据库训练深度神经网络模型，所述深度神经网络模型为SSD网络模型，所述SSD网络模型包括多分支卷积结构及多尺度特征图融合结构；/n使用训练好的深度神经网络模型识别所述视频图像，以输出每个物体类别的位置信息与尺寸信息。/n

【技术特征摘要】
1.一种基于深度学习的无人机航拍视频内容识别方法，其特征性在于，包括：
实时获取无人机拍摄的视频图像；
对所述视频图像进行抽帧处理以提取样本图像，对所述样本图像进行预处理；
对所述样本图像中的待识别物体进行标注，生成物体类别数据库；
利用数据增强技术扩充所述物体类别数据库；
利用扩充后的物体类别数据库训练深度神经网络模型，所述深度神经网络模型为SSD网络模型，所述SSD网络模型包括多分支卷积结构及多尺度特征图融合结构；
使用训练好的深度神经网络模型识别所述视频图像，以输出每个物体类别的位置信息与尺寸信息。

2.如权利要求1所述的基于深度学习的无人机航拍视频内容识别方法，其特征性在于，所述对样本图像进行预处理的步骤包括：
使用畸变矫正算法对所述样本图像进行矫正处理，以形成规整平面的样本图像；
对矫正处理后的样本图像进行压缩处理，以使所述样本图像达到能够进行目标识别的目标尺寸。

3.如权利要求1所述的基于深度学习的无人机航拍视频内容识别方法，其特征性在于，所述对样本图像中的待识别物体进行标注的方法包括人工标注法和/或图像目标检测算法。

4.如权利要求1所述的基于深度学习的无人机航拍视频内容识别方法，其特征性在于，所述利用数据增强技术扩充物体类别数据库的步骤包括：
以随机概率叠加的方式对所述物体类别数据库中的样本图像进行数据增强处理，所述数据增强处理包括旋转处理、填充式裁剪处理及灰度化数据处理。

5.如权利要求1所述的基于深度学习的无人机航拍视频内容识别方法，其特征性在于，所述利用扩充后的物体类别数据库训练深度神经网络模型的步骤包括：
将所述物体类别数据库中的多个样本图像输入所述深度神经网络模型；
将多个所述样本图像通过多分支卷积层分别进行卷积处理；
将经卷积处理后的多个样本图像分别进行归一化处理，以生成尺度的特征图；
将所有特征图进行特征融合处理；
将经拼接处理后的特征图通过卷积层进行卷积处理，以生成分支卷积特征图。

6.如权利要求5所述的基于深度学习的无人机航拍视频内容识别方法，其特征性在于，所述将所有特征图进行特征融...

【专利技术属性】
技术研发人员：吴晓琳，杜永红，张凯，夏林元，杨嘉贺，
申请(专利权)人：佛山聚卓科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人