下载一种基于文本引导图像块筛选的多模态表征学习方法的技术资料

文档序号:40162002

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明一种基于文本引导图像块筛选的多模态表征学习方法,属于计算机技术领域;包括准备预训练数据集,构建多模态预训练表征模型,对图像和文本进行特征提取,通过文本语义感知的图像块选择模块和视觉令牌摘要模块,获得与文本特征高度相关的图像特征。将文本...
该专利属于长春理工大学所有,仅供学习研究参考,未经过长春理工大学授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。