下载基于图文预训练模型的视频-文本检索方法及系统的技术资料

文档序号:40420876

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明涉及数据检索领域,更具体地,涉及一种基于图文预训练模型的视频‑文本检索方法及系统。本发明获取视频以及对应视频的描述文本;然后通过基于K‑means的改进聚类算法提取出视频的关键帧,将关键帧和文本分别通过编码器得到视频的初步特征表示以及...
该专利属于中山大学所有,仅供学习研究参考,未经过中山大学授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。