一种识别无人机航拍视频内人类交互行为的方法技术

技术编号:28674911 阅读:28 留言:0更新日期:2021-06-02 02:51
本发明专利技术属于人类行为识别技术领域,公开了一种识别无人机航拍视频内人类交互行为的方法,包括:抽取视频帧的开始帧和结束帧作为关键帧;将关键帧分割为由m×n个像素组成的多个M图像,在M图像上建立滑动窗口;任意选取一尺寸的滑动窗口,对关键帧图像进行滑动扫描,直至扫描像素覆盖关键帧的全帧图像的50%后,更换滑动窗口尺寸,重复扫描;在滑动窗口扫描的过程中,基于CNN生成关键帧全帧图像的概率向量,并对概率向量中的向量元素进行最大似然性运算;将开始帧与结束帧的两个概率向量转化为一个向量,并提取特征向量元素;基于支持向量机对提取的特征向量元素进行动作标签分配;本发明专利技术具有准确度高、远算量小、内存消耗低的优点。

【技术实现步骤摘要】
一种识别无人机航拍视频内人类交互行为的方法
本专利技术属于人类行为识别
,具体涉及一种识别无人机航拍视频内人类交互行为的方法。
技术介绍
现有技术中,具体结合图1可知,一般的人体行为识别步骤共分为六个:采集视频;选取感兴趣区域(ROI),分割原图像;ROI预处理;特征提取和表示;跟踪;以及理解动作(涉及分类器和分配动作标签),而在上述识别过程中,不仅需要进行大量数据的运算,还需要消耗大量内存以供提取特征。另外,针对上述提取特征,可分为传统的浅层结构学习算法模型和深度学习模型;其中:传统的浅层结构学习算法模型提取局部特征、全局特征、或二者融合。全局特征指提取物体的完整图像,包括轮廓表示、形状特征描述符、纹理特征等,适用于检索图像、检测物体、动作分类、识别人体;但是,全局特征的提取易受到如高斯噪声、脉冲噪声等噪声的影响。局部特征指一个矩形子图像的纹理特征,如物体的矩形子图像;但是,局部特征需要图像分割为若干区域,分割过程耗时长,需要执行大量运算。深度学习模型利用神经网络技术解决人体行为识别的问题,成功完成了如识别、分割本文档来自技高网...

【技术保护点】
1.一种识别无人机航拍视频内人类交互行为的方法,其特征在于,包括如下步骤:/nS1.抽取视频帧的开始帧和结束帧作为关键帧;/nS2.将关键帧分割为由m×n个像素组成的多个M图像,在M图像上建立滑动窗口,且滑动窗口的尺寸为m/i×n/i,其中i=3或4或5;/nS3.任意选取一尺寸的滑动窗口,对关键帧图像进行滑动扫描,直至扫描像素覆盖关键帧的全帧图像的N%后,更换滑动窗口尺寸,重复扫描,且N%≤100%;/nS4.在滑动窗口扫描的过程中,基于CNN生成关键帧全帧图像的概率向量,并对概率向量中的向量元素进行最大似然性运算;/nS5.基于联集函数将开始帧与结束帧的两个概率向量转化为一个向量,并提取特...

【技术特征摘要】
1.一种识别无人机航拍视频内人类交互行为的方法,其特征在于,包括如下步骤:
S1.抽取视频帧的开始帧和结束帧作为关键帧;
S2.将关键帧分割为由m×n个像素组成的多个M图像,在M图像上建立滑动窗口,且滑动窗口的尺寸为m/i×n/i,其中i=3或4或5;
S3.任意选取一尺寸的滑动窗口,对关键帧图像进行滑动扫描,直至扫描像素覆盖关键帧的全帧图像的N%后,更换滑动窗口尺寸,重复扫描,且N%≤100%;
S4.在滑动窗口扫描的过程中,基于CNN生成关键帧全帧图像的概率向量,并对概率向量中的向量元素进行最大似然性运算;
S5.基于联集函数将开始帧与结束帧的两个概率向量转化为一个向量,并提取特征向量元素,且特征向量元素映射于识别目标;
S6.基于支持向量机对提取的特征向量元素进行动作标签分配。


2.根据权利要求1所述的一种识别无人机航拍视频内人类交互行为的方法,其特征在于:步骤S2中,在进行滑动窗口的建立之前,若目标视频的分辨率过低,还包括利用超分辨率重建高分辨率图像的步骤。


3.根据权利要求2所述的一种识别无人机航拍视频内人类交互行为的方法,其特征在于,在进行所述超分辨率的重建之前,还包括预处理步骤,且预处理步骤包括:
基于CNN从低分辨率视频中抽取目标图像;
在CNN的层级结构中建立低分辨率目标图像与高分辨率目标图像之间的映射;
超分辨率学习CNN的层级结构中的映射。


4.根据权利要求1所述的一种识别...

【专利技术属性】
技术研发人员:赛义德·皮拉斯特加萨·沙姆瑟布尔
申请(专利权)人:赛义德·皮拉斯特加萨·沙姆瑟布尔
类型:发明
国别省市:四川;51

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1