一种基于渐进原型匹配的文本-动态图片跨模态检索方法技术

技术编号：41014272 阅读：21 留言：0更新日期：2024-04-18 21:51

本发明专利技术提出一种基于渐进原型匹配的文本‑动态图片跨模态检索方法，包括，获取文本查询集与动态图片候选集，并获取文本查询集和所述动态图片候选集之间的语义相似性；构建基于渐进原型匹配的细粒度文本‑动态图片的检索模型，检索模型包括动态图像嵌入模块、文本嵌入模块、全局分支模块、局部分支模块；将文本查询集与动态图片候选集作为输入，对检索模型进行训练，获取训练完成的检索模型；获取待查询文本与动态图片候选集，输入训练完成的检索模型，输出待查询文本与动态图片的相似度排序。通过本发明专利技术提出的方法，实现了针对文本、动态图片两种模态的一整套数据处理、模型训练和跨模态检索解决方案。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于数据处理领域。

技术介绍

1、文本-图像跨模态检索任务是一种基于内容语义的检索任务，其目标是根据给定的用户在一种模态中的表达，从另一模态中检索出相关样本。具体来说，这个任务通常包括两个子任务：文本到图像检索和图像到文本检索。在文本到图像检索中，给定一个文本查询，然后从图像候选集中检索出与该查询语义相关的图像，反之亦然。直觉上，可以简单地用一个图像帧来代表整个动态图像，从而把文本-动态图像检索任务转化为文本-图像跨模态检索任务。

2、传统的图文跨模态检索基于图像中的关键词，本质上是文本对文本的检索，不能满足用户越来越个性化的需求。随着深度学习的兴起，基于语义表征的图文跨模态检索方法逐渐占据主流，这些方法利用深度学习模型替代了早期基于统计分析的特征，利用模型挖掘图像和文本中的语义信息，解决了文本图像两种模态由于异质特性带来的语义鸿沟问题，学术界和工业界都对此做了大量的研究。近几年，文本-图片跨模态检索算法得到了迅猛发展，这些算法可以大致分为基于transformer、基于生成式对抗网络、基于概率图模型和基于大规模预...

【技术保护点】

1.一种基于渐进原型匹配的文本-动态图片跨模态检索方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，所述构建基于渐进原型匹配的细粒度文本-动态图片的检索模型，包括：

3.根据权利要求2所述的方法，其特征在于，所述通过所述动态图像嵌入模块提取动态图片的特征向量，包括：

4.根据权利要求2所述的方法，其特征在于，所述通过所述文本嵌入模块提取文本的特征向量，包括：

5.根据权利要求3所述的方法，其特征在于，基于所述动态图片的特征向量，通过所述全局分支模块获得所述动态图片的全局特征，包括：

6.根据权利要求2所...

【技术特征摘要】

1.一种基于渐进原型匹配的文本-动态图片跨模态检索方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，所述构建基于渐进原型匹配的细粒度文本-动态图片的检索模型，包括：

3.根据权利要求2所述的方法，其特征在于，所述通过所述动态图像嵌入模块提取动态图片的特征向量，包括：

4.根据权利要求2所述的方法，其特征在于，所述通过所述文本嵌入模块提取文本的特征向量，包括：

5.根据权利要求3所述的方法，其特征在于，基于所述动态图片的特征向量，通过所述全局分支模块获得所述动态图片的全局特征，包括：

6.根据权利要求2所述的方法，其特征在于，所述基于所述动态图片的特征向量、所述文本的特征向量、所述动态图片的全局特征，通过所述局部分支模块渐进生成所述文本和...

【专利技术属性】
技术研发人员：欧中洪，胡塞尔，宋美娜，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人