下载基于视觉大模型的非结构化场景下通行区域检测方法及装置的技术资料

文档序号:42143411

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明提出一种基于大型视觉模型ViT的仅使用RGB数据的非结构化场景下可通行区域检测的方法及装置,通过将图片输入预训练的ViT图像编码器提取丰富的语义特征以及隐层的特征,然后将特征输入到设计的分割解码器中,融合特征生成预测掩码,引入交叉熵损...
该专利属于中国科学院计算技术研究所所有,仅供学习研究参考,未经过中国科学院计算技术研究所授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。