基于大数据的图文检索方法及系统技术方案

技术编号:41221743 阅读:20 留言:0更新日期:2024-05-09 23:41
本发明专利技术实施例提供一种基于大数据的图文检索方法及系统,属于数据处理技术领域。该方法包括:获得待标注图像和待标注文本,并对待标注图像进行图像区域检测获得待标注图像对应的图像检测规则和对待标注文本进行文本区域检测获得待标注文本对应的文本检测规则;对图像检测规则和文本检测规则进行信息融合获得词袋模型;获得检索图像和检索文本,并根据词袋模型计算检索图像和检索文本对应的融合结果;根据融合结果对检索文本进行预处理,获得检索文本对应的处理文本;对处理文本进行关键词权值计算,获得处理文本对应的文本权重;根据文本权重确定检索文本与待标注文本之间的第一相似度值;根据第一相似度值确定检索图像和检索文本对应的检索结果。

【技术实现步骤摘要】

本专利技术涉及数据处理,尤其涉及一种基于大数据的图文检索方法及系统


技术介绍

1、图文检索是将图像信息和文本信息进行深度融合,从而形成统一的特征,进而将统一后的特征用于实现高效准确的大规模档案数据检索。该任务的关键问题在于如何准确地将图文两种模态之间的数据进行融合,进而保证文本信息和图像信息之间的对应关系保持不变,并提高融合特征的表征能力。相关技术中主要将图像信息和文本信息分别对应的特征进行加权处理,该方法无法准确挖掘图像信息和文本信息背后真实的关联关系,进而降低了图文检索效率和准确性。


技术实现思路

1、本专利技术实施例的主要目的在于提供一种基于大数据的图文检索方法及系统,旨在解决相关技术中无法准确挖掘图像信息和文本信息背后真实的关联关系,进而降低了图文检索效率和准确性的问题。

2、第一方面,本专利技术实施例提供一种基于大数据的图文检索方法,包括:

3、获得待标注图像和待标注文本,并对所述待标注图像进行图像区域检测获得所述待标注图像对应的图像检测规则和对所述待标注文本进行文本区域检本文档来自技高网...

【技术保护点】

1.一种基于大数据的图文检索方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述待标注图像进行图像区域检测获得所述待标注图像对应的图像检测规则和对所述待标注文本进行文本区域检测获得所述待标注文本对应的文本检测规则,包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述图像检测规则和所述文本检测规则进行信息融合获得所述待标注文本对应的词袋模型,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述图像检测规则和所述文本检测规则对所述待标注图像和所述待标注文本进行信息筛选,获得目标标注图像和目标标注文本,包括...

【技术特征摘要】

1.一种基于大数据的图文检索方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述待标注图像进行图像区域检测获得所述待标注图像对应的图像检测规则和对所述待标注文本进行文本区域检测获得所述待标注文本对应的文本检测规则,包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述图像检测规则和所述文本检测规则进行信息融合获得所述待标注文本对应的词袋模型,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述图像检测规则和所述文本检测规则对所述待标注图像和所述待标注文本进行信息筛选,获得目标标注图像和目标标注文本,包括:

5.根据权利要求1所述的方法,其特征在于,所述根据所述词袋模型计算...

【专利技术属性】
技术研发人员:卢弋洋刘培坤
申请(专利权)人:珠海泰坦软件系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1