一种基于渐进原型匹配的文本-动态图片跨模态检索方法技术

技术编号:41014272 阅读:21 留言:0更新日期:2024-04-18 21:51
本发明专利技术提出一种基于渐进原型匹配的文本‑动态图片跨模态检索方法,包括,获取文本查询集与动态图片候选集,并获取文本查询集和所述动态图片候选集之间的语义相似性;构建基于渐进原型匹配的细粒度文本‑动态图片的检索模型,检索模型包括动态图像嵌入模块、文本嵌入模块、全局分支模块、局部分支模块;将文本查询集与动态图片候选集作为输入,对检索模型进行训练,获取训练完成的检索模型;获取待查询文本与动态图片候选集,输入训练完成的检索模型,输出待查询文本与动态图片的相似度排序。通过本发明专利技术提出的方法,实现了针对文本、动态图片两种模态的一整套数据处理、模型训练和跨模态检索解决方案。

【技术实现步骤摘要】

本专利技术属于数据处理领域。


技术介绍

1、文本-图像跨模态检索任务是一种基于内容语义的检索任务,其目标是根据给定的用户在一种模态中的表达,从另一模态中检索出相关样本。具体来说,这个任务通常包括两个子任务:文本到图像检索和图像到文本检索。在文本到图像检索中,给定一个文本查询,然后从图像候选集中检索出与该查询语义相关的图像,反之亦然。直觉上,可以简单地用一个图像帧来代表整个动态图像,从而把文本-动态图像检索任务转化为文本-图像跨模态检索任务。

2、传统的图文跨模态检索基于图像中的关键词,本质上是文本对文本的检索,不能满足用户越来越个性化的需求。随着深度学习的兴起,基于语义表征的图文跨模态检索方法逐渐占据主流,这些方法利用深度学习模型替代了早期基于统计分析的特征,利用模型挖掘图像和文本中的语义信息,解决了文本图像两种模态由于异质特性带来的语义鸿沟问题,学术界和工业界都对此做了大量的研究。近几年,文本-图片跨模态检索算法得到了迅猛发展,这些算法可以大致分为基于transformer、基于生成式对抗网络、基于概率图模型和基于大规模预训练四类。基于tra本文档来自技高网...

【技术保护点】

1.一种基于渐进原型匹配的文本-动态图片跨模态检索方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述构建基于渐进原型匹配的细粒度文本-动态图片的检索模型,包括:

3.根据权利要求2所述的方法,其特征在于,所述通过所述动态图像嵌入模块提取动态图片的特征向量,包括:

4.根据权利要求2所述的方法,其特征在于,所述通过所述文本嵌入模块提取文本的特征向量,包括:

5.根据权利要求3所述的方法,其特征在于,基于所述动态图片的特征向量,通过所述全局分支模块获得所述动态图片的全局特征,包括:

6.根据权利要求2所...

【技术特征摘要】

1.一种基于渐进原型匹配的文本-动态图片跨模态检索方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述构建基于渐进原型匹配的细粒度文本-动态图片的检索模型,包括:

3.根据权利要求2所述的方法,其特征在于,所述通过所述动态图像嵌入模块提取动态图片的特征向量,包括:

4.根据权利要求2所述的方法,其特征在于,所述通过所述文本嵌入模块提取文本的特征向量,包括:

5.根据权利要求3所述的方法,其特征在于,基于所述动态图片的特征向量,通过所述全局分支模块获得所述动态图片的全局特征,包括:

6.根据权利要求2所述的方法,其特征在于,所述基于所述动态图片的特征向量、所述文本的特征向量、所述动态图片的全局特征,通过所述局部分支模块渐进生成所述文本和...

【专利技术属性】
技术研发人员:欧中洪胡塞尔宋美娜
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1