【技术实现步骤摘要】
本专利技术涉及视频识别,具体涉及一种局部语义增强编码器、窗口语义增强transformer块、航拍视频分类模型及方法。
技术介绍
1、随着航空自动化技术和遥感成像技术的不断发展,无人机得益于其机动性高、成本低、操作简易的特点,能够在不同视角下捕获海量的遥感影像。同时,可以通过装载着智能影像分析系统的无人机捕获并分析视频和图像,在众多应用领域有着极高的实用价值,如目标侦察、灾害探测、物流配送、病虫害分析等。
2、以人工判读方式处理无人机视频成本高、速度慢,难以适配无人机所获取的海量数据,因此需要通过一种更有效且高效的方式自动解译无人机视频的内容。深度学习是机器学习的一个重要研究分支,其通过深度神经网络的针对性设计来学习复杂的特征与表示,并凭借其优秀的鲁棒性与泛化性广泛应用于计算机视觉与自然语言处理等领域。
3、与人工判读方式相比,基于深度学习的方式可以更有效且高效的方式自动解译无人机视频的内容,其中卷积神经网络与视觉transformer是计算机视觉领域的主流深度学习方法。
4、transformer是
...【技术保护点】
1.一种局部语义增强编码器,其特征在于,包括:
2.根据权利要求1所述的局部语义增强编码器,其特征在于,所述窗口定位模块包括:
3.根据权利要求1所述的局部语义增强编码器,其特征在于,还包括:
4.一种窗口语义增强Transformer块,其特征在于,包括:
5.根据权利要求4所述的窗口语义增强Transformer块,其特征在于,所述标准编码器包括依次连接的第三层归一化模块、多头注意力模块、第四层归一化模块和第二多层感知机。
6.根据权利要求5所述的窗口语义增强Transformer块,其特征在于:
...【技术特征摘要】
1.一种局部语义增强编码器,其特征在于,包括:
2.根据权利要求1所述的局部语义增强编码器,其特征在于,所述窗口定位模块包括:
3.根据权利要求1所述的局部语义增强编码器,其特征在于,还包括:
4.一种窗口语义增强transformer块,其特征在于,包括:
5.根据权利要求4所述的窗口语义增强transformer块,其特征在于,所述标准编码器包括依次连接的第三层归一化模块、多头注意力模块、第四...
【专利技术属性】
技术研发人员:舒文强,蒲艺,倪千尧,黄嵩,周伯通,杨烽,丁忆,李朋龙,郑中,范文武,陈阳,艾道骅,赵雪然,卢建洪,李宇晗,
申请(专利权)人:重庆市地理信息和遥感应用中心重庆市测绘产品质量检验测试中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。