温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明提供了一种基于词性引导扩散网络(POSCD‑Net)的可控图像描述生成方法,包括:采用预训练的CLIP模型获取图像特征,并经过训练的映射网络MapNet将图像特征投影到潜在的嵌入空间中;基于扩散的词序列生成器获取对标签序列进行处理获取...该专利属于徐州安创矿视智能科技发展有限公司所有,仅供学习研究参考,未经过徐州安创矿视智能科技发展有限公司授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明提供了一种基于词性引导扩散网络(POSCD‑Net)的可控图像描述生成方法,包括:采用预训练的CLIP模型获取图像特征,并经过训练的映射网络MapNet将图像特征投影到潜在的嵌入空间中;基于扩散的词序列生成器获取对标签序列进行处理获取...