下载基于文本掩码监督图文特征融合的视觉定位方法的技术资料

文档序号:43509700

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

基于文本掩码监督图文特征融合的视觉定位方法,属于计算机视觉技术和图像处理技术领域,本发明使用ViT和BERT作为视觉编码器和文本编码器。首先,对输入文本进行两次掩码处理得到两个掩码的文本,掩码得到的扩充文本能够协同全文本一起利用视觉语言对齐...
该专利属于长春理工大学所有,仅供学习研究参考,未经过长春理工大学授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。