温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明涉及无人机视频数据解译技术领域,特别涉及一种基于多模态大模型的无人机视频摘要语义描述方法及系统,获取无人机视频数据的若干分段视频帧图像;利用多模态大模型提取图像特征,所述多模态大模型采用视觉语言基础模型中的图像编码器对输入的分段视频帧...该专利属于中国人民解放军网络空间部队信息工程大学所有,仅供学习研究参考,未经过中国人民解放军网络空间部队信息工程大学授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明涉及无人机视频数据解译技术领域,特别涉及一种基于多模态大模型的无人机视频摘要语义描述方法及系统,获取无人机视频数据的若干分段视频帧图像;利用多模态大模型提取图像特征,所述多模态大模型采用视觉语言基础模型中的图像编码器对输入的分段视频帧...