下载用于零化视觉指代表达理解方法、装置、设备及介质的技术资料

文档序号:41722320

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明提供一种用于零化视觉指代表达理解方法、装置、设备及介质,方法包括:将指代表达文本输入至大型语言模型中,输出各目标类别;将各目标类别和待指代图像输入至目标检测器中,输出各目标区域图像和目标位置和目标大小;基于大型语言模型将指代表达文本映...
该专利属于中国科学院自动化研究所所有,仅供学习研究参考,未经过中国科学院自动化研究所授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。