跨媒体大数据搜索方法及装置制造方法及图纸

技术编号：29614729 阅读：18 留言：0更新日期：2021-08-10 18:29

本说明书一个或多个实施例提供一种跨媒体大数据搜索方法及装置，包括：分别提取图像数据的图像语义特征和文本数据的文本语义特征；计算图像语义特征和文本语义特征之间的相似度，根据相似度分别确定图像注意力特征和文本注意力特征；以图像注意力特征为输入，经过图像表示网络输出图像上下文特征向量；以文本注意力特征为输入，经过文本表示网络输出文本上下文特征向量；根据图像上下文特征向量和文本上下文特征向量，利用对抗学习确定统一语义表示；基于统一语义表示进行搜索。本说明书的搜索方法能够获得精确的搜索结果。

全部详细技术资料下载

【技术实现步骤摘要】
跨媒体大数据搜索方法及装置
本说明书一个或多个实施例涉及大数据
，尤其涉及一种跨媒体大数据搜索方法及装置。
技术介绍
目前，网络中存在大量的图像、文本等多媒体数据资源，实现跨媒体搜索的关键在于跨媒体数据语义空间的建模，根据原始的多媒体数据中提取出语义特征，针对不同模态数据进行统一建模，消除跨模态数据之间的“异构鸿沟”，确定不同模态数据之间的统一语义表示，基于统一语义表示实现语义搜索。目前的方法没有充分学习跨媒体大数据的语义特征，所获得的统一语义表示难以实现精确搜索。
技术实现思路
有鉴于此，本说明书一个或多个实施例的目的在于提出一种跨媒体大数据搜索方法及装置，能够实现精准搜索。基于上述目的，本说明书一个或多个实施例提供了跨媒体大数据搜索方法，包括：分别提取图像数据的图像语义特征和文本数据的文本语义特征；计算所述图像语义特征和文本语义特征之间的相似度，根据所述相似度分别确定图像注意力特征和文本注意力特征；以所述图像注意力特征为输入，经过图像表示网络输出图像上下文特征向量；以所述文本注意力特征为输入，经过文本表示网络输出文本上下文特征向量；根据所述图像上下文特征向量和所述文本上下文特征向量，利用对抗学习确定统一语义表示；基于所述统一语义表示进行搜索。可选的，根据所述相似度确定图像注意力特征，包括：对于所述图像数据的每个图像区域，计算所述文本数据的所有文本片段的注意力权值；根据每个图像区域的图像语义特征和所述注意力权值...

【技术保护点】
1.跨媒体大数据搜索方法，其特征在于，包括：/n分别提取图像数据的图像语义特征和文本数据的文本语义特征；/n计算所述图像语义特征和文本语义特征之间的相似度，根据所述相似度分别确定图像注意力特征和文本注意力特征；/n以所述图像注意力特征为输入，经过图像表示网络输出图像上下文特征向量；/n以所述文本注意力特征为输入，经过文本表示网络输出文本上下文特征向量；/n根据所述图像上下文特征向量和所述文本上下文特征向量，利用对抗学习确定统一语义表示；/n基于所述统一语义表示进行搜索。/n

【技术特征摘要】
1.跨媒体大数据搜索方法，其特征在于，包括：
分别提取图像数据的图像语义特征和文本数据的文本语义特征；
计算所述图像语义特征和文本语义特征之间的相似度，根据所述相似度分别确定图像注意力特征和文本注意力特征；
以所述图像注意力特征为输入，经过图像表示网络输出图像上下文特征向量；
以所述文本注意力特征为输入，经过文本表示网络输出文本上下文特征向量；
根据所述图像上下文特征向量和所述文本上下文特征向量，利用对抗学习确定统一语义表示；
基于所述统一语义表示进行搜索。

2.根据权利要求1所述的方法，其特征在于，根据所述相似度确定图像注意力特征，包括：
对于所述图像数据的每个图像区域，计算所述文本数据的所有文本片段的注意力权值；
根据每个图像区域的图像语义特征和所述注意力权值，计算所述图像注意力特征。

3.根据权利要求1所述的方法，其特征在于，根据所述相似度确定文本注意力特征，包括：
对于所述文本数据的每个文本片段，计算所述图像数据的所有图像区域的注意力权值；
根据每个文本片段的文本语义特征和所述注意力权值，计算文本注意力特征。

4.根据权利要求1所述的方法，其特征在于，所述分别提取图像数据的图像语义特征和文本数据的文本语义特征之前，还包括：
获取查询内容；
对所述查询内容进行语义扩展，得到语义扩展后的查询内容；所述语义扩展后的查询内容包括图像数据和文本数据。

5.根据权利要求1所述的方法，其特征在于，所述利用对抗学习确定统一语义表示之后，还包括：
对所述统一语义表示进行哈希二值化处理，得到二值化的统一语义表示。

【专利技术属性】
技术研发人员：梁美玉，王笑笑，杜军平，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人