当前位置: 首页 > 专利查询>之江实验室专利>正文

图文搜索数据库的构建方法、装置、数据库以及存储介质制造方法及图纸

技术编号:44017003 阅读:12 留言:0更新日期:2025-01-15 01:02
本申请涉及一种图文搜索数据库的构建方法、装置、数据库以及存储介质。所述方法包括:对获取到的文献进行解析,提取得到所述文献的图像信息、文本信息;基于所述图像信息、所述文本信息,构建所述文献的至少一个图文对,所述图文对包括图像以及对应的图注文本;基于图像以及图注文本,生成图像的图像特征向量;从文本信息中提取所述文献的关键文本信息,基于关键文本信息,生成文献的文本特征向量;基于各文献的所述图像特征向量、所述文本特征向量,构建得到图文搜索数据库。采用本方法实现了融合文本、图像等多模态数据的文献特征提取,挖掘文献间的深层专业关联,能够提高天文领域进行图文搜索相关文献的准确率。

【技术实现步骤摘要】

本申请涉及天文图文推荐,特别是涉及一种图文搜索数据库的构建方法、装置、数据库以及存储介质


技术介绍

1、随着天文学研究的快速发展,天文科研文献数量呈现爆发式增长。据统计,主流天文期刊和预印本平台每年发表的论文数量已超过数十万篇,且每年以较高的速率的递增。

2、这些文献不仅包含传统的文本内容,还包括大量的观测图像、光谱数据、射电数据等多模态科学数据。对天文研究人员而言,如何从海量的多模态文献中快速准确地找到与其研究方向相关的重要文献,已成为一个亟待解决的难题。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够融合文本、图像、光谱等多模态数据的文献特征提取框架,全面刻画文献的科学内容的图文搜索数据库的构建方法、装置、数据库以及存储介质。

2、第一方面,本申请提供了一种图文搜索数据库的构建方法,所述方法包括:

3、对获取到的文献进行解析,提取得到所述文献的图像信息、文本信息;

4、基于所述图像信息、所述文本信息,构建所述文献的至少一个图文对,所述图文对本文档来自技高网...

【技术保护点】

1.一种图文搜索数据库的构建方法,其特征在于,所述方法包括:

2.根据权利要求1所述的图文搜索数据库的构建方法,其特征在于,所述基于所述图像以及所述图注文本,生成所述图像的图像特征向量包括:

3.根据权利要求1所述的图文搜索数据库的构建方法,其特征在于,所述从所述文本信息中提取所述文献的关键文本信息,基于所述关键文本信息,生成所述文献的文本特征向量包括:

4.根据权利要求1所述的图文搜索数据库的构建方法,其特征在于,所述基于各所述文献的所述图像特征向量、所述文本特征向量,构建得到图文搜索数据库包括:

5.根据权利要求1至权利要求4任一项所述...

【技术特征摘要】

1.一种图文搜索数据库的构建方法,其特征在于,所述方法包括:

2.根据权利要求1所述的图文搜索数据库的构建方法,其特征在于,所述基于所述图像以及所述图注文本,生成所述图像的图像特征向量包括:

3.根据权利要求1所述的图文搜索数据库的构建方法,其特征在于,所述从所述文本信息中提取所述文献的关键文本信息,基于所述关键文本信息,生成所述文献的文本特征向量包括:

4.根据权利要求1所述的图文搜索数据库的构建方法,其特征在于,所述基于各所述文献的所述图像特征向量、所述文本特征向量,构建得到图文搜索数据库包括:

5.根据权利要求1至权利要求4任一项所述的图文搜索数据库的构建方法,其特征在于,所述图文搜索数据库还包括各所述文献的基础信息,所述方法还包括:...

【专利技术属性】
技术研发人员:张睿陆矜菁汪方野陈一家严笑然
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1