【技术实现步骤摘要】
本申请涉及天文图文推荐,特别是涉及一种图文搜索数据库的构建方法、装置、数据库以及存储介质。
技术介绍
1、随着天文学研究的快速发展,天文科研文献数量呈现爆发式增长。据统计,主流天文期刊和预印本平台每年发表的论文数量已超过数十万篇,且每年以较高的速率的递增。
2、这些文献不仅包含传统的文本内容,还包括大量的观测图像、光谱数据、射电数据等多模态科学数据。对天文研究人员而言,如何从海量的多模态文献中快速准确地找到与其研究方向相关的重要文献,已成为一个亟待解决的难题。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够融合文本、图像、光谱等多模态数据的文献特征提取框架,全面刻画文献的科学内容的图文搜索数据库的构建方法、装置、数据库以及存储介质。
2、第一方面,本申请提供了一种图文搜索数据库的构建方法,所述方法包括:
3、对获取到的文献进行解析,提取得到所述文献的图像信息、文本信息;
4、基于所述图像信息、所述文本信息,构建所述文献的至少一
...【技术保护点】
1.一种图文搜索数据库的构建方法,其特征在于,所述方法包括:
2.根据权利要求1所述的图文搜索数据库的构建方法,其特征在于,所述基于所述图像以及所述图注文本,生成所述图像的图像特征向量包括:
3.根据权利要求1所述的图文搜索数据库的构建方法,其特征在于,所述从所述文本信息中提取所述文献的关键文本信息,基于所述关键文本信息,生成所述文献的文本特征向量包括:
4.根据权利要求1所述的图文搜索数据库的构建方法,其特征在于,所述基于各所述文献的所述图像特征向量、所述文本特征向量,构建得到图文搜索数据库包括:
5.根据权利要求1至
...【技术特征摘要】
1.一种图文搜索数据库的构建方法,其特征在于,所述方法包括:
2.根据权利要求1所述的图文搜索数据库的构建方法,其特征在于,所述基于所述图像以及所述图注文本,生成所述图像的图像特征向量包括:
3.根据权利要求1所述的图文搜索数据库的构建方法,其特征在于,所述从所述文本信息中提取所述文献的关键文本信息,基于所述关键文本信息,生成所述文献的文本特征向量包括:
4.根据权利要求1所述的图文搜索数据库的构建方法,其特征在于,所述基于各所述文献的所述图像特征向量、所述文本特征向量,构建得到图文搜索数据库包括:
5.根据权利要求1至权利要求4任一项所述的图文搜索数据库的构建方法,其特征在于,所述图文搜索数据库还包括各所述文献的基础信息,所述方法还包括:...
【专利技术属性】
技术研发人员:张睿,陆矜菁,汪方野,陈一家,严笑然,
申请(专利权)人:之江实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。